訂閱
糾錯
加入自媒體

機器學習:開啟智能創(chuàng)新之門

2017-10-23 09:59
來源: e-works

三、機器學習:實現(xiàn)人工智能的高效方法

從廣義上來說,機器學習是一種能夠賦予機器學習的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來說,機器學習是一種通過利用數(shù)據(jù),訓(xùn)練出模型,然后使用模型預(yù)測的一種方法。國外有些學者對機器學習進行了定義大同小異,有學者認為,機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究;也有學者認為,機器學習是指利用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準。由此可知,機器學習是通過經(jīng)驗或數(shù)據(jù)來改進算法的研究,通過算法讓機器從大量歷史數(shù)據(jù)中學習規(guī)律,得到某種模式并利用此模型預(yù)測未來,機器在學習的過程中,處理的數(shù)據(jù)越多,預(yù)測結(jié)果就越精準。

機器學習在人工智能的研究中具有十分重要的地位。它是人工智能的核心,是使計算機具有智能的根本途徑,其應(yīng)用遍及人工智能的各個領(lǐng)域。從20世紀50年代人們就開始了對機器學習的研究,從最初的基于神經(jīng)元模型以及函數(shù)逼近論的方法研究,到以符號演算為基礎(chǔ)的規(guī)則學習和決策樹學習的產(chǎn)生,以及之后的認知心理學中歸納、解釋、類比等概念的引入,至最新的計算學習理論和統(tǒng)計學習的興起,機器學習一直都在相關(guān)學科的實踐應(yīng)用中起著主導(dǎo)作用,F(xiàn)在已取得了不少成就,并分化出許多研究方向,主要有符號學習、連接學習和統(tǒng)計學習等。

(一)機器學習的發(fā)展歷程

機器學習發(fā)展過程大體可分為以下四個階段:

1.50年代中葉到60年代中葉

在這個時期,所研究的是“沒有知識”的學習,即“無知”學習;其研究目標是各類自組織系統(tǒng)和自適應(yīng)系統(tǒng);其主要研究方法是不斷修改系統(tǒng)的控制參數(shù)以改進系統(tǒng)的執(zhí)行能力,不涉及與具體任務(wù)有關(guān)的知識。指導(dǎo)本階段研究的理論基礎(chǔ)是早在40年代就開始研究的神經(jīng)網(wǎng)絡(luò)模型。隨著電子計算機的產(chǎn)生和發(fā)展,機器學習的實現(xiàn)才成為可能。這個階段的研究導(dǎo)致了模式識別這門新科學的誕生,同時形成了機器學習的二種重要方法,即判別函數(shù)法和進化學習。塞繆爾的下棋程序就是使用判別函數(shù)法的典型例子。不過,這種脫離知識的感知型學習系統(tǒng)具有很大的局限性。無論是神經(jīng)模型、進化學習或是判別函數(shù)法,所取得的學習結(jié)果都很有限,遠不能滿足人們對機器學習系統(tǒng)的期望。在這個時期,我國研制了數(shù)字識別學習機。

2.60年代中葉至70年代中葉

本階段的研究目標是模擬人類的概念學習過程,并采用邏輯結(jié)構(gòu)或圖結(jié)構(gòu)作為機器內(nèi)部描述。機器能夠采用符號來描述概念(符號概念獲。⑻岢鲫P(guān)于學習概念的各種假設(shè)。本階段的代表性工作有溫斯頓(Winston)的結(jié)構(gòu)學習系統(tǒng)和海斯·羅思(Hayes Roth)等的基于邏輯的歸納學習系統(tǒng)。雖然這類學習系統(tǒng)取得較大的成功,但只能學習單一概念,而且未能投入實際應(yīng)用。此外,神經(jīng)網(wǎng)絡(luò)學習機因理論缺陷未能達到預(yù)期效果而轉(zhuǎn)入低潮。因此,使那些對機器學習的進展抱過大希望的人們感到失望。他們稱這個時期為“黑暗時期”。

3.70年代中葉至80年代中葉

在這個時期,人們從學習單個概念擴展到學習多個概念,探索不同的學習策略和各種學習方法。機器的學習過程一般都建立在大規(guī)模的知識庫上,實現(xiàn)知識強化學習。尤其令人鼓舞的是,本階段已開始把學習系統(tǒng)與各種應(yīng)用結(jié)合起來,并取得很大的成功,促進機器學習的發(fā)展。在出現(xiàn)第一個專家學習系統(tǒng)之后,示例歸約學習系統(tǒng)成為研究主流,自動知識獲取成為機器學習的應(yīng)用研究目標。1980年,在美國的卡內(nèi)基梅隆大學(CMU)召開了第一屆機器學習國際研討會,標志著機器學習研究已在全世界興起。此后,機器歸納學習進入應(yīng)用。1986年,國際雜志《機器學習》(Machine Learning)創(chuàng)刊,迎來了機器學習蓬勃發(fā)展的新時期。70年代末,中國科學院自動化研究所進行質(zhì)譜分析和模式文法推斷研究,表明我國的機器學習研究得到恢復(fù)。1980年西蒙來華傳播機器學習的火種后,我國的機器學習研究出現(xiàn)了新局面。

4.機器學習最新階段始于1986年

一方面,由于神經(jīng)網(wǎng)絡(luò)研究的重新興起,對連接機制學習方法的研究方興未艾,機器學習的研究已經(jīng)在全世界范圍內(nèi)出現(xiàn)新的高潮,機器學習的基本理論和綜合系統(tǒng)的研究得到加強和發(fā)展。另一方面,對實驗研究和應(yīng)用研究得到前所未有的重視,機器學習有了更強的研究手段和環(huán)境。從而出現(xiàn)了符號學習、神經(jīng)網(wǎng)絡(luò)學習、進化學習和基于行為主義(actionism)的強化學習等百家爭鳴的局面。

機器學習:開啟智能創(chuàng)新之門

圖2  機器學習的發(fā)展歷程

(二)機器學習的結(jié)構(gòu)模型

機器學習的本質(zhì)就是算法。算法是用于解決問題的一系列指令。程序員開發(fā)的用于指導(dǎo)計算機進行新任務(wù)的算法是我們今天看到的先進數(shù)字世界的基礎(chǔ)。計算機算法根據(jù)某些指令和規(guī)則,將大量數(shù)據(jù)組織到信息和服務(wù)中。機器學習向計算機發(fā)出指令,允許計算機從數(shù)據(jù)中學習,而不需要程序員做出新的分步指令。

機器學習的基本過程是給學習算法提供訓(xùn)練數(shù)據(jù)。然后,學習算法基于數(shù)據(jù)的推論生成一組新的規(guī)則。這本質(zhì)上就是生成一種新的算法,稱之為機器學習模型。通過使用不同的訓(xùn)練數(shù)據(jù),相同的學習算法可以生成不同的模型。從數(shù)據(jù)中推理出新的指令是機器學習的核心優(yōu)勢。它還突出了數(shù)據(jù)的關(guān)鍵作用:用于訓(xùn)練算法的可用數(shù)據(jù)越多,算法學習到的就越多。事實上,AI 的許多最新進展并不是由于學習算法的激進創(chuàng)新,而是現(xiàn)在積累了大量的可用數(shù)據(jù)。

機器學習:開啟智能創(chuàng)新之門

圖3  機器學習的結(jié)構(gòu)模型

(三)機器學習的工作方式

1.選擇數(shù)據(jù):首先將原始數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗證數(shù)據(jù)和測試數(shù)據(jù);

2.數(shù)據(jù)建模:再使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型;

3.驗證模型:使用驗證數(shù)據(jù)輸入到已經(jīng)構(gòu)建的數(shù)據(jù)模型中;

4.測試模型:使用測試數(shù)據(jù)檢查被驗證的模型的性能表現(xiàn);

5.使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測;

6.調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)。

機器學習:開啟智能創(chuàng)新之門

圖4 機器學習的工作方式

(四)機器學習發(fā)展的關(guān)鍵基石:

(1)海量數(shù)據(jù):人工智能的能量來源是穩(wěn)定的數(shù)據(jù)流。機器學習可以通過海量數(shù)據(jù)來“訓(xùn)練” 自己,才能開發(fā)新規(guī)則來完成日益復(fù)雜的任務(wù)。目前全球有超過30億人在線,約170 億個連接的設(shè)備或傳感器,產(chǎn)生了大量數(shù)據(jù),而數(shù)據(jù)存儲成本的降低,使得這些數(shù)據(jù)易于被使用。

(2)超強計算:強大的計算機和通過互聯(lián)網(wǎng)連接遠程處理能力使可以處理海量數(shù)據(jù)的機器學習技術(shù)成為可能,具某媒體稱,ALPHGO之所以能在與對李世石的對決中取得歷史性的勝利,這與它硬件配置的1920個CPU和280個GPU超強運算系統(tǒng)密不可分,可見計算能力對于機器學習是至關(guān)重要的。

(3)優(yōu)秀算法:在機器學習中,學習算法(learning algorithms)創(chuàng)建了規(guī)則,允許計算機從數(shù)據(jù)中學習,從而推論出新的指令(算法模型),這也是機器學習的核心優(yōu)勢。新的機器學習技術(shù),特別是分層神經(jīng)網(wǎng)絡(luò),也被稱為“深度學習”,啟發(fā)了新的服務(wù),刺激了對人工智能這一領(lǐng)域其他方面的投資和研究。

機器學習:開啟智能創(chuàng)新之門

圖5  機器學習的關(guān)鍵基石

<上一頁  1  2  3  4  5  6  7  8  9  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號