黃宜華教授:大數(shù)據(jù)時代下機器學習的革新
人工智能歷史由來已久,早在1308年,加泰羅尼亞詩人兼神學家者雷蒙·盧爾(Ramon Llull)出版《The Ultimate General Art》,詳細描述了其“邏輯機”的概念,這便是最早人工智能理念的誕生。隨著時代發(fā)展,如今的人工智能早已發(fā)生了翻天覆地的變化,以前的機器只關(guān)注算法本身,如今進入到大數(shù)據(jù)時代,一切都將發(fā)生變化。
黃宜華(中國計算機學會大數(shù)據(jù)專家委員會常務委員、副秘書長)
11月13至14日,由OFweek中國高科技行業(yè)門戶主辦,OFweek人工智能網(wǎng)承辦的“OFweek2017中國人工智能大會”在深圳舉辦。中國計算機學會大數(shù)據(jù)專家委員會常務委員、副秘書長黃宜華教授在《大數(shù)據(jù)機器學習---從算法到系統(tǒng)》主題演講中,重點分析了目前機器該如何在大數(shù)據(jù)之下進行學習。
大數(shù)據(jù)下的機器學習
首先,黃宜華教授對于大數(shù)據(jù)定義做了簡單介紹。他認為,一般意義上大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進行感知、獲取、管理、處理和服務的數(shù)據(jù)集合。
近幾年,大數(shù)據(jù)逐漸成為學術(shù)界和產(chǎn)業(yè)界的熱點,已在很多技術(shù)和行業(yè)內(nèi)廣泛應用。從大規(guī)模數(shù)據(jù)庫到商業(yè)智能和數(shù)據(jù)挖掘應用、從搜索引擎到推薦系統(tǒng)、以及最新的語音識別、翻譯等。大數(shù)據(jù)算法的設(shè)計、分析和工程涉及很多方面,包括大規(guī)模并行計算、流算法、云技術(shù)等。由于大數(shù)據(jù)存在復雜、高維、多變等特性,如何從真實、凌亂、無模式和復雜的大數(shù)據(jù)中挖掘出人類感興趣的知識,迫切需要更深刻的機器學習理論進行指導。
大數(shù)據(jù)強大的計算能力,已成為推動大數(shù)據(jù)時代人工智能技術(shù)和應用發(fā)展的動力,將大數(shù)據(jù)機器學習和人工智能推上了新一輪發(fā)展浪潮。大數(shù)據(jù)隱含著很多深度知識和價值,大數(shù)據(jù)智能化分析挖掘可為行業(yè)/企業(yè)帶來巨大的商業(yè)價值。大數(shù)據(jù)的深度價值發(fā)現(xiàn)需要使用基于機器學習的智能化復雜分析才能完成,機器學習和數(shù)據(jù)挖掘已成為將大數(shù)據(jù)轉(zhuǎn)換成有用知識的關(guān)鍵技術(shù)。傳統(tǒng)計算時代,僅僅關(guān)注機器學習算法本身,而大數(shù)據(jù)時代的機器學習,已經(jīng)不僅僅是一個算法問題,更是一個完整的大數(shù)據(jù)學習系統(tǒng)問題。
大數(shù)據(jù)學習系統(tǒng)未來發(fā)展趨勢
要實現(xiàn)高效的大數(shù)據(jù)機器學習,需要構(gòu)建一個能同時支持機器學習算法設(shè)計和大規(guī)模數(shù)據(jù)處理的一體化大數(shù)據(jù)機器學習系統(tǒng)。研究設(shè)計高效、可擴展且易于使用的大數(shù)據(jù)機器學習系統(tǒng)面臨諸多技術(shù)挑戰(zhàn)。近年來,大數(shù)據(jù)浪潮的興起,推動了大數(shù)據(jù)機器學習的迅猛發(fā)展,使大數(shù)據(jù)機器學習系統(tǒng)成為大數(shù)據(jù)領(lǐng)域的一個熱點研究問題。
隨后,黃宜華教授還具體介紹了國內(nèi)外大數(shù)據(jù)機器學習系統(tǒng)的基本概念、基本研究問題、技術(shù)特征、系統(tǒng)分類以及典型系統(tǒng)。
在整個機器學習的發(fā)展歷程中,主要有兩大研究方向。一是研究學習機制,注重探索、模擬人的學習機制;二是研究如何有效利用信息,注重從巨量數(shù)據(jù)中獲取隱藏的、有效的、可理解的知識。學習機制的研究是機器學習產(chǎn)生的源泉,但隨著大數(shù)據(jù)時代各行業(yè)對數(shù)據(jù)分析需求的持續(xù)增加,通過機器學習高效地獲取知識,已逐漸成為當今機器學習技術(shù)發(fā)展的主要推動力。
最后,黃宜華教授具體解釋道,大數(shù)據(jù)時代的機器學習更強調(diào)“學習本身是手段”,機器學習成為一種支持技術(shù)和服務技術(shù),如何基于機器學習對復雜多樣的數(shù)據(jù)進行深層次的分析,更高效地利用信息成為當前機器學習研究的主要方向。機器學習越來越朝著智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術(shù)的一個重要源泉。另外,在大數(shù)據(jù)時代,隨著數(shù)據(jù)產(chǎn)生速度的持續(xù)加快,數(shù)據(jù)的體量有了前所未有的增長,而需要分析的新的數(shù)據(jù)種類也在不斷涌現(xiàn),如文本的理解、文本情感的分析、圖像的檢索和理解、圖形和網(wǎng)絡(luò)數(shù)據(jù)的分析等,機器學習研究領(lǐng)域涌現(xiàn)了很多新的研究方向,很多新的機器學習方法被提出并得到了廣泛應用。
更多詳細內(nèi)容,敬請關(guān)注OFweek人工智能網(wǎng)后續(xù)專題報道!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題