訂閱
糾錯
加入自媒體

當機器學習遇見“眾包”,新一代人工智能訓練模式誕生

2018-09-04 08:34
來源: 獵云網

十多年前,我第一次接觸“眾包”這個概念,當時我還是倫敦商學院的一名學生。那天,我們的教授拿著一罐硬幣走進了教室。

他讓我們每個人都猜一下罐子里有多少錢。罐子在教室里傳了一圈,同時教授在白板上記下了每人的猜想數額,總共有100左右,當時我估計里面有30英鎊。所有同學都估計完畢后,教授打開了一個信封,從中取出了一張紙條并告訴我們:罐子里的硬幣實際金額為18.76英鎊。

最開始我認為教授想要告訴大家,“罐中幣”這個猜想本身是不合理的,但教授接下來的舉動卻出乎我的意料:他計算了我們所有人的猜測數目的平均值,計算結果出奇地接近18.76英鎊。眾人智慧的力量就這樣呈現在我們眼前,并且比我們自己99%的估計值都要精準(我們中只有一個人確實猜到了真實的數額)。

幾個月后,我和我的同學Janeen成立了一家眾包公司。當時我們召集了最優(yōu)秀的安全和防務創(chuàng)新者來解決行業(yè)和政府客戶方面復雜難題。那是2005年,當時的眾包浪潮孕育了InnoCentive、維基百科以及Amazon Mechanical Turk,這三家公司在獲取和使用大眾的知識和靈感方面處于領先地位。

現有公司還啟動了各種眾包計劃,共同創(chuàng)建像My Starbucks Ideas(星巴克客戶意見及創(chuàng)意反饋網站)這樣的產品,以抓牢客戶和供應商的心。

第二代眾包

在過去的幾年里,眾包已經發(fā)展成為一種更務實的企業(yè)方法,企業(yè)們進行眾包不再是為了共創(chuàng)產品或者提高創(chuàng)造力,而是為了對他們的人工智能系統(tǒng)進行訓練。

谷歌董事長兼長期服務首席執(zhí)行官Eric Schmidt在2016年表示,下一代谷歌將成為眾包AI公司。他說,如果他想創(chuàng)辦一家新公司,他會以眾包的形式從眾多專家中獲取數據,并用于培養(yǎng)具有學習能力的人工智能,這些人工智能最終會變得比任何一位專家都更加優(yōu)秀,然后我們會將我們的人工智能反過來賣給這些專家。

還有一些大型企業(yè)利用眾包來提供那些通常由承包商或員工執(zhí)行的服務。例如,Swisscom收購了眾包平臺Mila,并將其維護和維修工作進行對外眾包。該公司似乎還希望通過智能手機和AR從這些人群中收集數據,用于培訓AI系統(tǒng)來執(zhí)行大部分人工工作。

那么人群目前來講只是AI的炮灰嗎?

眾包的關鍵是外包“微任務”,這些“微任務”往往不需要個人付出太多努力(比如猜測罐子里的硬幣數額),但當這些任務被眾人執(zhí)行時卻能帶來真實的價值。

在人工智能的時代,我們看到了這樣的一個反差現象:單獨的個人數據是無用的,但數千個的眾人數據卻能夠共同創(chuàng)造出真實價值。

但我預測眾包會走的更遠。今天,我們正在利用人群的知識以對數據進行判斷——例如將圖片標記為日落或日出。但下一步將是人群自主提供數據集,例如,我們可以每天以人工智能系統(tǒng)所需的數據格式提供有關我們自己的健康信息,以便醫(yī)藥公司開發(fā)新藥。比如我曾經推薦過的一家強大的非營利性企業(yè),即CancerBase,就正在研究治療癌癥的方法。在下一代眾包中,人群將會因其提供數據而獲得報酬,或者像CancerBase一樣,人群將會自愿免費提供數據,以幫助推進人類醫(yī)療水平的發(fā)展。

那么在新一代的眾包背景下,我的“罐中幣”問題會變成什么樣呢?教授不會要求學生對硬幣的數量進行估計,而是要求他們每個人從錢包中拍下一組隨機的硬幣照片。然后,學生將會在照片上寫上圖片中的硬幣數量,并將這張照片發(fā)送到AI應用程序,然后該AI就精確地判斷出任何罐子中包含的硬幣數額。

歡迎來到一個嶄新的眾包世界,而我們每個人都將為眾包提供數據。

聲明: 本文系OFweek根據授權轉載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號