機(jī)器學(xué)習(xí):開啟智能創(chuàng)新之門
三、機(jī)器學(xué)習(xí):實(shí)現(xiàn)人工智能的高效方法
從廣義上來說,機(jī)器學(xué)習(xí)是一種能夠賦予機(jī)器學(xué)習(xí)的能力以此讓它完成直接編程無法完成的功能的方法。但從實(shí)踐的意義上來說,機(jī)器學(xué)習(xí)是一種通過利用數(shù)據(jù),訓(xùn)練出模型,然后使用模型預(yù)測(cè)的一種方法。國外有些學(xué)者對(duì)機(jī)器學(xué)習(xí)進(jìn)行了定義大同小異,有學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是對(duì)能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究;也有學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是指利用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。由此可知,機(jī)器學(xué)習(xí)是通過經(jīng)驗(yàn)或數(shù)據(jù)來改進(jìn)算法的研究,通過算法讓機(jī)器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,得到某種模式并利用此模型預(yù)測(cè)未來,機(jī)器在學(xué)習(xí)的過程中,處理的數(shù)據(jù)越多,預(yù)測(cè)結(jié)果就越精準(zhǔn)。
機(jī)器學(xué)習(xí)在人工智能的研究中具有十分重要的地位。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。從20世紀(jì)50年代人們就開始了對(duì)機(jī)器學(xué)習(xí)的研究,從最初的基于神經(jīng)元模型以及函數(shù)逼近論的方法研究,到以符號(hào)演算為基礎(chǔ)的規(guī)則學(xué)習(xí)和決策樹學(xué)習(xí)的產(chǎn)生,以及之后的認(rèn)知心理學(xué)中歸納、解釋、類比等概念的引入,至最新的計(jì)算學(xué)習(xí)理論和統(tǒng)計(jì)學(xué)習(xí)的興起,機(jī)器學(xué)習(xí)一直都在相關(guān)學(xué)科的實(shí)踐應(yīng)用中起著主導(dǎo)作用。現(xiàn)在已取得了不少成就,并分化出許多研究方向,主要有符號(hào)學(xué)習(xí)、連接學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)等。
(一)機(jī)器學(xué)習(xí)的發(fā)展歷程
機(jī)器學(xué)習(xí)發(fā)展過程大體可分為以下四個(gè)階段:
1.50年代中葉到60年代中葉
在這個(gè)時(shí)期,所研究的是“沒有知識(shí)”的學(xué)習(xí),即“無知”學(xué)習(xí);其研究目標(biāo)是各類自組織系統(tǒng)和自適應(yīng)系統(tǒng);其主要研究方法是不斷修改系統(tǒng)的控制參數(shù)以改進(jìn)系統(tǒng)的執(zhí)行能力,不涉及與具體任務(wù)有關(guān)的知識(shí)。指導(dǎo)本階段研究的理論基礎(chǔ)是早在40年代就開始研究的神經(jīng)網(wǎng)絡(luò)模型。隨著電子計(jì)算機(jī)的產(chǎn)生和發(fā)展,機(jī)器學(xué)習(xí)的實(shí)現(xiàn)才成為可能。這個(gè)階段的研究導(dǎo)致了模式識(shí)別這門新科學(xué)的誕生,同時(shí)形成了機(jī)器學(xué)習(xí)的二種重要方法,即判別函數(shù)法和進(jìn)化學(xué)習(xí)。塞繆爾的下棋程序就是使用判別函數(shù)法的典型例子。不過,這種脫離知識(shí)的感知型學(xué)習(xí)系統(tǒng)具有很大的局限性。無論是神經(jīng)模型、進(jìn)化學(xué)習(xí)或是判別函數(shù)法,所取得的學(xué)習(xí)結(jié)果都很有限,遠(yuǎn)不能滿足人們對(duì)機(jī)器學(xué)習(xí)系統(tǒng)的期望。在這個(gè)時(shí)期,我國研制了數(shù)字識(shí)別學(xué)習(xí)機(jī)。
2.60年代中葉至70年代中葉
本階段的研究目標(biāo)是模擬人類的概念學(xué)習(xí)過程,并采用邏輯結(jié)構(gòu)或圖結(jié)構(gòu)作為機(jī)器內(nèi)部描述。機(jī)器能夠采用符號(hào)來描述概念(符號(hào)概念獲取),并提出關(guān)于學(xué)習(xí)概念的各種假設(shè)。本階段的代表性工作有溫斯頓(Winston)的結(jié)構(gòu)學(xué)習(xí)系統(tǒng)和海斯·羅思(Hayes Roth)等的基于邏輯的歸納學(xué)習(xí)系統(tǒng)。雖然這類學(xué)習(xí)系統(tǒng)取得較大的成功,但只能學(xué)習(xí)單一概念,而且未能投入實(shí)際應(yīng)用。此外,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)因理論缺陷未能達(dá)到預(yù)期效果而轉(zhuǎn)入低潮。因此,使那些對(duì)機(jī)器學(xué)習(xí)的進(jìn)展抱過大希望的人們感到失望。他們稱這個(gè)時(shí)期為“黑暗時(shí)期”。
3.70年代中葉至80年代中葉
在這個(gè)時(shí)期,人們從學(xué)習(xí)單個(gè)概念擴(kuò)展到學(xué)習(xí)多個(gè)概念,探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法。機(jī)器的學(xué)習(xí)過程一般都建立在大規(guī)模的知識(shí)庫上,實(shí)現(xiàn)知識(shí)強(qiáng)化學(xué)習(xí)。尤其令人鼓舞的是,本階段已開始把學(xué)習(xí)系統(tǒng)與各種應(yīng)用結(jié)合起來,并取得很大的成功,促進(jìn)機(jī)器學(xué)習(xí)的發(fā)展。在出現(xiàn)第一個(gè)專家學(xué)習(xí)系統(tǒng)之后,示例歸約學(xué)習(xí)系統(tǒng)成為研究主流,自動(dòng)知識(shí)獲取成為機(jī)器學(xué)習(xí)的應(yīng)用研究目標(biāo)。1980年,在美國的卡內(nèi)基梅隆大學(xué)(CMU)召開了第一屆機(jī)器學(xué)習(xí)國際研討會(huì),標(biāo)志著機(jī)器學(xué)習(xí)研究已在全世界興起。此后,機(jī)器歸納學(xué)習(xí)進(jìn)入應(yīng)用。1986年,國際雜志《機(jī)器學(xué)習(xí)》(Machine Learning)創(chuàng)刊,迎來了機(jī)器學(xué)習(xí)蓬勃發(fā)展的新時(shí)期。70年代末,中國科學(xué)院自動(dòng)化研究所進(jìn)行質(zhì)譜分析和模式文法推斷研究,表明我國的機(jī)器學(xué)習(xí)研究得到恢復(fù)。1980年西蒙來華傳播機(jī)器學(xué)習(xí)的火種后,我國的機(jī)器學(xué)習(xí)研究出現(xiàn)了新局面。
4.機(jī)器學(xué)習(xí)最新階段始于1986年
一方面,由于神經(jīng)網(wǎng)絡(luò)研究的重新興起,對(duì)連接機(jī)制學(xué)習(xí)方法的研究方興未艾,機(jī)器學(xué)習(xí)的研究已經(jīng)在全世界范圍內(nèi)出現(xiàn)新的高潮,機(jī)器學(xué)習(xí)的基本理論和綜合系統(tǒng)的研究得到加強(qiáng)和發(fā)展。另一方面,對(duì)實(shí)驗(yàn)研究和應(yīng)用研究得到前所未有的重視,機(jī)器學(xué)習(xí)有了更強(qiáng)的研究手段和環(huán)境。從而出現(xiàn)了符號(hào)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、進(jìn)化學(xué)習(xí)和基于行為主義(actionism)的強(qiáng)化學(xué)習(xí)等百家爭(zhēng)鳴的局面。
圖2 機(jī)器學(xué)習(xí)的發(fā)展歷程
(二)機(jī)器學(xué)習(xí)的結(jié)構(gòu)模型
機(jī)器學(xué)習(xí)的本質(zhì)就是算法。算法是用于解決問題的一系列指令。程序員開發(fā)的用于指導(dǎo)計(jì)算機(jī)進(jìn)行新任務(wù)的算法是我們今天看到的先進(jìn)數(shù)字世界的基礎(chǔ)。計(jì)算機(jī)算法根據(jù)某些指令和規(guī)則,將大量數(shù)據(jù)組織到信息和服務(wù)中。機(jī)器學(xué)習(xí)向計(jì)算機(jī)發(fā)出指令,允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),而不需要程序員做出新的分步指令。
機(jī)器學(xué)習(xí)的基本過程是給學(xué)習(xí)算法提供訓(xùn)練數(shù)據(jù)。然后,學(xué)習(xí)算法基于數(shù)據(jù)的推論生成一組新的規(guī)則。這本質(zhì)上就是生成一種新的算法,稱之為機(jī)器學(xué)習(xí)模型。通過使用不同的訓(xùn)練數(shù)據(jù),相同的學(xué)習(xí)算法可以生成不同的模型。從數(shù)據(jù)中推理出新的指令是機(jī)器學(xué)習(xí)的核心優(yōu)勢(shì)。它還突出了數(shù)據(jù)的關(guān)鍵作用:用于訓(xùn)練算法的可用數(shù)據(jù)越多,算法學(xué)習(xí)到的就越多。事實(shí)上,AI 的許多最新進(jìn)展并不是由于學(xué)習(xí)算法的激進(jìn)創(chuàng)新,而是現(xiàn)在積累了大量的可用數(shù)據(jù)。
圖3 機(jī)器學(xué)習(xí)的結(jié)構(gòu)模型
(三)機(jī)器學(xué)習(xí)的工作方式
1.選擇數(shù)據(jù):首先將原始數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù);
2.?dāng)?shù)據(jù)建模:再使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型;
3.驗(yàn)證模型:使用驗(yàn)證數(shù)據(jù)輸入到已經(jīng)構(gòu)建的數(shù)據(jù)模型中;
4.測(cè)試模型:使用測(cè)試數(shù)據(jù)檢查被驗(yàn)證的模型的性能表現(xiàn);
5.使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測(cè);
6.調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)。
圖4 機(jī)器學(xué)習(xí)的工作方式
(四)機(jī)器學(xué)習(xí)發(fā)展的關(guān)鍵基石:
(1)海量數(shù)據(jù):人工智能的能量來源是穩(wěn)定的數(shù)據(jù)流。機(jī)器學(xué)習(xí)可以通過海量數(shù)據(jù)來“訓(xùn)練” 自己,才能開發(fā)新規(guī)則來完成日益復(fù)雜的任務(wù)。目前全球有超過30億人在線,約170 億個(gè)連接的設(shè)備或傳感器,產(chǎn)生了大量數(shù)據(jù),而數(shù)據(jù)存儲(chǔ)成本的降低,使得這些數(shù)據(jù)易于被使用。
(2)超強(qiáng)計(jì)算:強(qiáng)大的計(jì)算機(jī)和通過互聯(lián)網(wǎng)連接遠(yuǎn)程處理能力使可以處理海量數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù)成為可能,具某媒體稱,ALPHGO之所以能在與對(duì)李世石的對(duì)決中取得歷史性的勝利,這與它硬件配置的1920個(gè)CPU和280個(gè)GPU超強(qiáng)運(yùn)算系統(tǒng)密不可分,可見計(jì)算能力對(duì)于機(jī)器學(xué)習(xí)是至關(guān)重要的。
(3)優(yōu)秀算法:在機(jī)器學(xué)習(xí)中,學(xué)習(xí)算法(learning algorithms)創(chuàng)建了規(guī)則,允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),從而推論出新的指令(算法模型),這也是機(jī)器學(xué)習(xí)的核心優(yōu)勢(shì)。新的機(jī)器學(xué)習(xí)技術(shù),特別是分層神經(jīng)網(wǎng)絡(luò),也被稱為“深度學(xué)習(xí)”,啟發(fā)了新的服務(wù),刺激了對(duì)人工智能這一領(lǐng)域其他方面的投資和研究。
圖5 機(jī)器學(xué)習(xí)的關(guān)鍵基石

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋果把身家押在Siri上:一場(chǎng)輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會(huì)區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對(duì)接會(huì)成功舉辦