国产成人无码牲交免费视频,四虎成人www国产精品

當(dāng)前位置： OFweek 人工智能網(wǎng) > 機器學(xué)習(xí) > 正文

機器學(xué)習(xí)：開啟智能創(chuàng)新之門

2017-10-23 09:59

來源： e-works

三、機器學(xué)習(xí)：實現(xiàn)人工智能的高效方法

從廣義上來說，機器學(xué)習(xí)是一種能夠賦予機器學(xué)習(xí)的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來說，機器學(xué)習(xí)是一種通過利用數(shù)據(jù)，訓(xùn)練出模型，然后使用模型預(yù)測的一種方法。國外有些學(xué)者對機器學(xué)習(xí)進(jìn)行了定義大同小異，有學(xué)者認(rèn)為，機器學(xué)習(xí)是對能通過經(jīng)驗自動改進(jìn)的計算機算法的研究；也有學(xué)者認(rèn)為，機器學(xué)習(xí)是指利用數(shù)據(jù)或以往的經(jīng)驗，以此優(yōu)化計算機程序的性能標(biāo)準(zhǔn)。由此可知，機器學(xué)習(xí)是通過經(jīng)驗或數(shù)據(jù)來改進(jìn)算法的研究，通過算法讓機器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律，得到某種模式并利用此模型預(yù)測未來，機器在學(xué)習(xí)的過程中，處理的數(shù)據(jù)越多，預(yù)測結(jié)果就越精準(zhǔn)。

機器學(xué)習(xí)在人工智能的研究中具有十分重要的地位。它是人工智能的核心，是使計算機具有智能的根本途徑，其應(yīng)用遍及人工智能的各個領(lǐng)域。從20世紀(jì)50年代人們就開始了對機器學(xué)習(xí)的研究，從最初的基于神經(jīng)元模型以及函數(shù)逼近論的方法研究，到以符號演算為基礎(chǔ)的規(guī)則學(xué)習(xí)和決策樹學(xué)習(xí)的產(chǎn)生，以及之后的認(rèn)知心理學(xué)中歸納、解釋、類比等概念的引入，至最新的計算學(xué)習(xí)理論和統(tǒng)計學(xué)習(xí)的興起，機器學(xué)習(xí)一直都在相關(guān)學(xué)科的實踐應(yīng)用中起著主導(dǎo)作用�，F(xiàn)在已取得了不少成就，并分化出許多研究方向，主要有符號學(xué)習(xí)、連接學(xué)習(xí)和統(tǒng)計學(xué)習(xí)等。

（一）機器學(xué)習(xí)的發(fā)展歷程

機器學(xué)習(xí)發(fā)展過程大體可分為以下四個階段：

1．50年代中葉到60年代中葉

在這個時期，所研究的是“沒有知識”的學(xué)習(xí)，即“無知”學(xué)習(xí)；其研究目標(biāo)是各類自組織系統(tǒng)和自適應(yīng)系統(tǒng)；其主要研究方法是不斷修改系統(tǒng)的控制參數(shù)以改進(jìn)系統(tǒng)的執(zhí)行能力，不涉及與具體任務(wù)有關(guān)的知識。指導(dǎo)本階段研究的理論基礎(chǔ)是早在40年代就開始研究的神經(jīng)網(wǎng)絡(luò)模型。隨著電子計算機的產(chǎn)生和發(fā)展，機器學(xué)習(xí)的實現(xiàn)才成為可能。這個階段的研究導(dǎo)致了模式識別這門新科學(xué)的誕生，同時形成了機器學(xué)習(xí)的二種重要方法，即判別函數(shù)法和進(jìn)化學(xué)習(xí)。塞繆爾的下棋程序就是使用判別函數(shù)法的典型例子。不過，這種脫離知識的感知型學(xué)習(xí)系統(tǒng)具有很大的局限性。無論是神經(jīng)模型、進(jìn)化學(xué)習(xí)或是判別函數(shù)法，所取得的學(xué)習(xí)結(jié)果都很有限，遠(yuǎn)不能滿足人們對機器學(xué)習(xí)系統(tǒng)的期望。在這個時期，我國研制了數(shù)字識別學(xué)習(xí)機。

2．60年代中葉至70年代中葉

本階段的研究目標(biāo)是模擬人類的概念學(xué)習(xí)過程，并采用邏輯結(jié)構(gòu)或圖結(jié)構(gòu)作為機器內(nèi)部描述。機器能夠采用符號來描述概念（符號概念獲取），并提出關(guān)于學(xué)習(xí)概念的各種假設(shè)。本階段的代表性工作有溫斯頓（Winston）的結(jié)構(gòu)學(xué)習(xí)系統(tǒng)和海斯·羅思（Hayes Roth）等的基于邏輯的歸納學(xué)習(xí)系統(tǒng)。雖然這類學(xué)習(xí)系統(tǒng)取得較大的成功，但只能學(xué)習(xí)單一概念，而且未能投入實際應(yīng)用。此外，神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機因理論缺陷未能達(dá)到預(yù)期效果而轉(zhuǎn)入低潮。因此，使那些對機器學(xué)習(xí)的進(jìn)展抱過大希望的人們感到失望。他們稱這個時期為“黑暗時期”。

3．70年代中葉至80年代中葉

在這個時期，人們從學(xué)習(xí)單個概念擴展到學(xué)習(xí)多個概念，探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法。機器的學(xué)習(xí)過程一般都建立在大規(guī)模的知識庫上，實現(xiàn)知識強化學(xué)習(xí)。尤其令人鼓舞的是，本階段已開始把學(xué)習(xí)系統(tǒng)與各種應(yīng)用結(jié)合起來，并取得很大的成功，促進(jìn)機器學(xué)習(xí)的發(fā)展。在出現(xiàn)第一個專家學(xué)習(xí)系統(tǒng)之后，示例歸約學(xué)習(xí)系統(tǒng)成為研究主流，自動知識獲取成為機器學(xué)習(xí)的應(yīng)用研究目標(biāo)。1980年，在美國的卡內(nèi)基梅隆大學(xué)（CMU）召開了第一屆機器學(xué)習(xí)國際研討會，標(biāo)志著機器學(xué)習(xí)研究已在全世界興起。此后，機器歸納學(xué)習(xí)進(jìn)入應(yīng)用。1986年，國際雜志《機器學(xué)習(xí)》（Machine Learning）創(chuàng)刊，迎來了機器學(xué)習(xí)蓬勃發(fā)展的新時期。70年代末，中國科學(xué)院自動化研究所進(jìn)行質(zhì)譜分析和模式文法推斷研究，表明我國的機器學(xué)習(xí)研究得到恢復(fù)。1980年西蒙來華傳播機器學(xué)習(xí)的火種后，我國的機器學(xué)習(xí)研究出現(xiàn)了新局面。

4．機器學(xué)習(xí)最新階段始于1986年

一方面，由于神經(jīng)網(wǎng)絡(luò)研究的重新興起，對連接機制學(xué)習(xí)方法的研究方興未艾，機器學(xué)習(xí)的研究已經(jīng)在全世界范圍內(nèi)出現(xiàn)新的高潮，機器學(xué)習(xí)的基本理論和綜合系統(tǒng)的研究得到加強和發(fā)展。另一方面，對實驗研究和應(yīng)用研究得到前所未有的重視，機器學(xué)習(xí)有了更強的研究手段和環(huán)境。從而出現(xiàn)了符號學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、進(jìn)化學(xué)習(xí)和基于行為主義（actionism）的強化學(xué)習(xí)等百家爭鳴的局面。

機器學(xué)習(xí)：開啟智能創(chuàng)新之門

圖2 機器學(xué)習(xí)的發(fā)展歷程

（二）機器學(xué)習(xí)的結(jié)構(gòu)模型

機器學(xué)習(xí)的本質(zhì)就是算法。算法是用于解決問題的一系列指令。程序員開發(fā)的用于指導(dǎo)計算機進(jìn)行新任務(wù)的算法是我們今天看到的先進(jìn)數(shù)字世界的基礎(chǔ)。計算機算法根據(jù)某些指令和規(guī)則，將大量數(shù)據(jù)組織到信息和服務(wù)中。機器學(xué)習(xí)向計算機發(fā)出指令，允許計算機從數(shù)據(jù)中學(xué)習(xí)，而不需要程序員做出新的分步指令。

機器學(xué)習(xí)的基本過程是給學(xué)習(xí)算法提供訓(xùn)練數(shù)據(jù)。然后，學(xué)習(xí)算法基于數(shù)據(jù)的推論生成一組新的規(guī)則。這本質(zhì)上就是生成一種新的算法，稱之為機器學(xué)習(xí)模型。通過使用不同的訓(xùn)練數(shù)據(jù)，相同的學(xué)習(xí)算法可以生成不同的模型。從數(shù)據(jù)中推理出新的指令是機器學(xué)習(xí)的核心優(yōu)勢。它還突出了數(shù)據(jù)的關(guān)鍵作用：用于訓(xùn)練算法的可用數(shù)據(jù)越多，算法學(xué)習(xí)到的就越多。事實上，AI 的許多最新進(jìn)展并不是由于學(xué)習(xí)算法的激進(jìn)創(chuàng)新，而是現(xiàn)在積累了大量的可用數(shù)據(jù)。

機器學(xué)習(xí)：開啟智能創(chuàng)新之門

圖3 機器學(xué)習(xí)的結(jié)構(gòu)模型

（三）機器學(xué)習(xí)的工作方式

1．選擇數(shù)據(jù)：首先將原始數(shù)據(jù)分成三組：訓(xùn)練數(shù)據(jù)、驗證數(shù)據(jù)和測試數(shù)據(jù)；

2．?dāng)?shù)據(jù)建模：再使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型；

3．驗證模型：使用驗證數(shù)據(jù)輸入到已經(jīng)構(gòu)建的數(shù)據(jù)模型中；

4．測試模型：使用測試數(shù)據(jù)檢查被驗證的模型的性能表現(xiàn)；

5．使用模型：使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測；

6．調(diào)優(yōu)模型：使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)。

機器學(xué)習(xí)：開啟智能創(chuàng)新之門

圖4 機器學(xué)習(xí)的工作方式

（四）機器學(xué)習(xí)發(fā)展的關(guān)鍵基石：

（1）海量數(shù)據(jù)：人工智能的能量來源是穩(wěn)定的數(shù)據(jù)流。機器學(xué)習(xí)可以通過海量數(shù)據(jù)來“訓(xùn)練” 自己，才能開發(fā)新規(guī)則來完成日益復(fù)雜的任務(wù)。目前全球有超過30億人在線，約170 億個連接的設(shè)備或傳感器，產(chǎn)生了大量數(shù)據(jù)，而數(shù)據(jù)存儲成本的降低，使得這些數(shù)據(jù)易于被使用。

（2）超強計算：強大的計算機和通過互聯(lián)網(wǎng)連接遠(yuǎn)程處理能力使可以處理海量數(shù)據(jù)的機器學(xué)習(xí)技術(shù)成為可能，具某媒體稱，ALPHGO之所以能在與對李世石的對決中取得歷史性的勝利，這與它硬件配置的1920個CPU和280個GPU超強運算系統(tǒng)密不可分，可見計算能力對于機器學(xué)習(xí)是至關(guān)重要的。

（3）優(yōu)秀算法：在機器學(xué)習(xí)中，學(xué)習(xí)算法（learning algorithms）創(chuàng)建了規(guī)則，允許計算機從數(shù)據(jù)中學(xué)習(xí)，從而推論出新的指令（算法模型），這也是機器學(xué)習(xí)的核心優(yōu)勢。新的機器學(xué)習(xí)技術(shù)，特別是分層神經(jīng)網(wǎng)絡(luò)，也被稱為“深度學(xué)習(xí)”，啟發(fā)了新的服務(wù)，刺激了對人工智能這一領(lǐng)域其他方面的投資和研究。

機器學(xué)習(xí)：開啟智能創(chuàng)新之門