訂閱
糾錯
加入自媒體

AI趨勢:更小的數(shù)據(jù)集構建算法

一直以來,一個讓人困惑的疑問是,難道只有阿里巴巴、騰訊、Facebook、谷歌、蘋果這些數(shù)據(jù)黑洞擁有者,才能使用AI?

文/智物

”不要相信那種(基于海量數(shù)據(jù)的AI優(yōu)勢)炒作!盠anding AI創(chuàng)始人、CEO,曾經的谷歌大腦的創(chuàng)始人,百度首席科學家吳恩達簡單明了地談到自己對下一步AI趨勢的看法。

他認為,AI的下一步趨勢應該是圍繞更小的數(shù)據(jù)集構建算法。他舉的例子是,智能手機裝配線上的劃痕檢測,不會有哪個工廠擁有上百萬張的智能手機劃痕圖片數(shù)據(jù)。

他指的是之前的圖像識別機器學習算法,需要靠百萬張圖片數(shù)據(jù),用以訓練模型和系統(tǒng)。但是,現(xiàn)在的手機巨頭們應該沒有哪個工廠,有這樣多的瑕疵產品的圖片。

除非是20年前的某家中國手機廠。

吳恩達認為,AI在這些傳統(tǒng)行業(yè)中的價值將會比消費互聯(lián)網(wǎng)中潛在的價值會更大。雖然,目前還處于一個比較初級的階段。

麥肯錫預測,在醫(yī)療保健、制造業(yè)和農業(yè)當中,AI可以幫助實現(xiàn)13萬億美金的附加價值。

但問題在于,較小數(shù)據(jù)樣本意味著數(shù)據(jù)的質量,比數(shù)據(jù)規(guī)模更重要。吳恩達指出,不同的人,即使是同一個工廠的兩個檢查員,記錄數(shù)據(jù)的方式也會完全不同,讓較小的數(shù)據(jù)集的采納面臨挑戰(zhàn)。

吳恩達關于Small Data的觀點,此前在工業(yè)界和學術界已有討論!敦敻弧肪W(wǎng)站在評述的時候將其與此前數(shù)據(jù)石油觀點對立,這一派觀點的代表人物是創(chuàng)新工場創(chuàng)始人李開復。

李開復曾稱,中國外賣訂購的數(shù)量是美國的10倍,移動支付的數(shù)量是美國的50倍,共享單車的使用是美國的300倍,這些數(shù)據(jù)可以成為新的商業(yè)引擎,從而幫助改善用戶體驗。

據(jù)此,中國公司因為擁有海量的數(shù)據(jù),而在AI時代擁有優(yōu)勢。李開復的結論是,中國會成為數(shù)據(jù)時代的沙特。《經濟學人》也曾經用一篇封面文章,來解釋數(shù)據(jù)作為新時代的石油的觀點。

李開復這一觀點一個附帶的結論是,如今的互聯(lián)網(wǎng)數(shù)據(jù)牢牢把握在位數(shù)不多的幾家中、美巨頭手中,比如阿里巴巴、騰訊、Facebook、谷歌、蘋果等等。這也成為李開復口中所謂的數(shù)據(jù)黑洞,這些公司在AI領域的巨大優(yōu)勢,以及其他創(chuàng)始團隊難以逾越的鴻溝。

吳恩達明確反對這一觀點,他認為,不應該相信這一炒作,即使是沒有海量數(shù)據(jù)集,初創(chuàng)企業(yè)和大公司仍然有機會去推動AI創(chuàng)新。龐大的數(shù)據(jù)集除了對互聯(lián)網(wǎng)公司有用之外,沒有太大的應用空間。

“龐大的搜索數(shù)據(jù)、經濟數(shù)據(jù)對于檢測時裝缺陷毫無用處,對于醫(yī)療記錄也沒有太大的幫助!

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號