四虎www永久在线精品,少妇spa推油被扣高潮,色欲av永久无码精品无码蜜桃

機器學習：開啟智能創(chuàng)新之門

2017-10-23 09:59

2．無監(jiān)督學習（Unsupervised Learning）

給學習算法提供的數(shù)據(jù)是未標記的，并且要求算法識別輸入數(shù)據(jù)中的模式，主要是建立一個模型，用其試著對輸入的數(shù)據(jù)進行解釋，并用于下次輸入�，F(xiàn)實情況下往往很多數(shù)據(jù)集都有大量的未標記樣本，有標記的樣本反而比較少。如果直接棄用，很大程度上會導(dǎo)致模型精度低。這種情況解決的思路往往是結(jié)合有標記的樣本，通過估計的方法把未標記樣本變?yōu)閭蔚挠袠擞洏颖�，所以無監(jiān)督學習比監(jiān)督學習更難掌握。主要用于解決聚類和降維問題，常見的算法有：

（1）聚類算法：把一組對象分組化的任務(wù)，使得在同一組的對象比起其它組的對象，它們彼此更加相似。常用的聚類算法包括：

①K－means算法：這是典型的基于原型的目標函數(shù)聚類方法的代表，它是數(shù)據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù)，利用函數(shù)求極值的方法得到迭代運算的調(diào)整規(guī)則。其優(yōu)點是算法足夠快速、簡單，并且如果預(yù)處理數(shù)據(jù)和特征工程十分有效，那么該聚類算法將擁有極高的靈活性。缺點是該算法需要指定集群的數(shù)量，而K值的選擇通常都不是那么容易確定的。另外，如果訓(xùn)練數(shù)據(jù)中的真實集群并不是類球狀的，那么K均值聚類會得出一些比較差的集群。

機器學習：開啟智能創(chuàng)新之門

圖15 K－means算法

②Expectation Maximisation （EM）：這是一種迭代算法，用于含有隱變量（latent variable）的概率參數(shù)模型的最大似然估計或極大后驗概率估計。EM算法的主要目的是提供一個簡單的迭代算法計算后驗密度函數(shù)，它的最大優(yōu)點是簡單和穩(wěn)定，但容易陷入局部最優(yōu)。

機器學習：開啟智能創(chuàng)新之門

圖16 EM算法

③Affinity Propagation 聚類：AP 聚類算法是一種相對較新的聚類算法，該聚類算法基于兩個樣本點之間的圖形距離（graph distances）確定集群。采用該聚類方法的集群擁有更小和不相等的大小。優(yōu)點：該算法不需要指出明確的集群數(shù)量。缺點：AP 聚類算法主要的缺點就是訓(xùn)練速度比較慢，并需要大量內(nèi)存，因此也就很難擴展到大數(shù)據(jù)集中。另外，該算法同樣假定潛在的集群是類球狀的。

④層次聚類（Hierarchical Clustering）：層次聚類是一系列基于以下概念的聚類算法：是通過對數(shù)據(jù)集按照某種方法進行層次分解，直到滿足某種條件為止。按照分類原理的不同，可以分為凝聚和分裂兩種方法。優(yōu)點：層次聚類最主要的優(yōu)點是集群不再需要假設(shè)為類球形。另外其也可以擴展到大數(shù)據(jù)集。缺點：有點像 K 均值聚類，該算法需要設(shè)定集群的數(shù)量。

機器學習：開啟智能創(chuàng)新之門

圖17 層次聚類算法

⑤DBSCAN：這是一個比較有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同，它將簇定義為密度相連的點的最大集合，能夠把具有足夠高密度的區(qū)域劃分為簇，并可在噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。它將樣本點的密集區(qū)域組成一個集群。優(yōu)點：DBSCAN 不需要假設(shè)集群為球狀，并且它的性能是可擴展的。此外，它不需要每個點都被分配到一個集群中，這降低了集群的異常數(shù)據(jù)。缺點：用戶必須要調(diào)整「epsilon」和「min＿sample」這兩個定義了集群密度的超參數(shù)。DBSCAN 對這些超參數(shù)非常敏感。

機器學習：開啟智能創(chuàng)新之門

圖18 DBSCAN算法

（2）降維算法：其主要特征是將數(shù)據(jù)從高維降低到低維層次，最大程度的保留了數(shù)據(jù)的信息。代表算法是：

①主要代表是主成分分析算法（PCA算法）：主成分分析也稱主分量分析，旨在利用降維的思想，把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標（即主成分），其中每個主成分都能夠反映原始變量的大部分信息，且所含信息互不重復(fù)。這種方法在引進多方面變量的同時將復(fù)雜因素歸結(jié)為幾個主成分，使問題簡單化，同時得到的結(jié)果更加科學有效的數(shù)據(jù)信息。

機器學習：開啟智能創(chuàng)新之門

圖19 PCA算法

②局部線性嵌入（Locally linear embeddingLLE）LLE降維算法：一種非線性降維算法，它能夠使降維后的數(shù)據(jù)較好地保持原有流形結(jié)構(gòu) 。該算法是針對非線性信號特征矢量維數(shù)的優(yōu)化方法，這種維數(shù)優(yōu)化并不是僅僅在數(shù)量上簡單的約簡，而是在保持原始數(shù)據(jù)性質(zhì)不變的情況下，將高維空間的信號映射到低維空間上，即特征值的二次提取。

機器學習：開啟智能創(chuàng)新之門

圖20 LLE降維算法

3．強化學習（Reinforcement Learning）
該算法與動態(tài)環(huán)境相互作用，把環(huán)境的反饋作為輸入，通過學習選擇能達到其目標的最優(yōu)動作。強化學習這一方法背后的數(shù)學原理與監(jiān)督／非監(jiān)督學習略有差異。監(jiān)督／非監(jiān)督學習更多地應(yīng)用了統(tǒng)計學，而強化學習更多地結(jié)合了離散數(shù)學、隨機過程這些數(shù)學方法。常見的算法有：

①TD（λ）算法：TD（temporal differenee）學習是強化學習技術(shù)中最主要的學習技術(shù)之一．TD學習是蒙特卡羅思想和動態(tài)規(guī)劃思想的結(jié)合，即一方面TD算法在不需要系統(tǒng)模型情況下可以直接從agent經(jīng)驗中學習；另一方面TD算法和動態(tài)規(guī)劃一樣，利用估計的值函數(shù)進行迭代。

機器學習：開啟智能創(chuàng)新之門

圖21 TD（λ）算法

②Q＿learning算法：Q＿learning學習是一種模型無關(guān)的強化學習算法，又稱為離策略TD學習（off－policy TD）．不同于TD算法，Q＿learning迭代時采用狀態(tài)＿動作對的獎賞和Q （s，a）作為估計函數(shù)，在Agent每一次學習迭代時都需要考察每一個行為，可確保學習過程收斂。

機器學習：開啟智能創(chuàng)新之門