機(jī)器學(xué)習(xí)根本沒(méi)有捷徑
O'Reilly最新的調(diào)查數(shù)據(jù)顯示,大數(shù)據(jù)仍然只是1%,或者15%的企業(yè)游戲。大多數(shù)的企業(yè)(85%)依然沒(méi)有破解AI和機(jī)器學(xué)習(xí)的密碼。僅僅只有15%的“見(jiàn)多識(shí)廣”的企業(yè)在生產(chǎn)過(guò)程中運(yùn)行一些數(shù)據(jù)模型超過(guò)了5年。更重要的是,這些企業(yè)更傾向于在一些重要的領(lǐng)域花費(fèi)時(shí)間和精力,比如模型偏差和數(shù)據(jù)隱私。相對(duì)而言,那些還屬于初學(xué)者之列的企業(yè)仍然還在努力嘗試著尋找啟動(dòng)按鈕。
不幸的是,對(duì)于那些希望通過(guò)自動(dòng)快捷方式比如Google的AutoML或者通過(guò)聘請(qǐng)咨詢(xún)公司縮小數(shù)據(jù)科學(xué)差距的企業(yè),我們給出的答案是:實(shí)現(xiàn)數(shù)據(jù)科學(xué)的確需要花費(fèi)時(shí)間,而且沒(méi)有捷徑可循。
聰明的企業(yè)專(zhuān)注于深層次數(shù)據(jù)
首先,值得注意的是,O'Reilly的調(diào)查數(shù)據(jù)來(lái)自于其自選的一群人:那些曾經(jīng)參加過(guò)O'Reilly活動(dòng)的,或者參加過(guò)該公司在線(xiàn)研討會(huì)或通過(guò)其他途徑與之有接觸的人。這些人群對(duì)于數(shù)據(jù)科學(xué)都有前瞻性的興趣,即使(按照調(diào)查數(shù)據(jù)的顯示)他們中的大部分人并沒(méi)有從事太多的相關(guān)工作。對(duì)于那些沉浸在大數(shù)據(jù)體驗(yàn)中的人來(lái)說(shuō),最好的客戶(hù)群體就是那些被稱(chēng)為“見(jiàn)多識(shí)廣”的企業(yè),它們?cè)谏a(chǎn)過(guò)程中使用的數(shù)據(jù)模型已經(jīng)運(yùn)行了5年以上。
從調(diào)查上可以發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象,那就是這些企業(yè)是怎樣稱(chēng)呼他們自己的數(shù)據(jù)專(zhuān)家的。具有豐富數(shù)據(jù)經(jīng)驗(yàn)的企業(yè)稱(chēng)之為數(shù)據(jù)科學(xué)家。而那些思維尚停留在上世紀(jì)90年代“數(shù)據(jù)挖掘”模式的企業(yè)則更傾向于稱(chēng)其為“數(shù)據(jù)分析師”。如下圖所示。
調(diào)查發(fā)現(xiàn),無(wú)論企業(yè)選擇如何稱(chēng)呼他們的數(shù)據(jù)專(zhuān)家,企業(yè)在AI和機(jī)器學(xué)習(xí)方面的經(jīng)驗(yàn)越豐富,他們就越有可能依靠?jī)?nèi)部數(shù)據(jù)科學(xué)團(tuán)隊(duì)建立模型,如下圖所示。
幾乎沒(méi)人關(guān)注云機(jī)器學(xué)習(xí)服務(wù)(至少現(xiàn)在還沒(méi)有)。那些只有2年以下生產(chǎn)經(jīng)驗(yàn)的企業(yè)傾向于依賴(lài)外部的顧問(wèn)來(lái)搭建機(jī)器學(xué)習(xí)模型。對(duì)于這樣的企業(yè)而言,這種感覺(jué)就像一種不用投入人力而享受數(shù)據(jù)科學(xué)收益的機(jī)會(huì),但這是一個(gè)非常愚蠢的方法。
企業(yè)的數(shù)據(jù)越復(fù)雜,其數(shù)據(jù)科學(xué)團(tuán)隊(duì)就越能建立模型,并評(píng)估項(xiàng)目成功的關(guān)鍵指標(biāo)?v觀所有的企業(yè),產(chǎn)品經(jīng)理對(duì)于項(xiàng)目成功的作用是36%,管理團(tuán)隊(duì)的數(shù)據(jù)是29%,數(shù)據(jù)科學(xué)團(tuán)隊(duì)的貢獻(xiàn)是21%。
對(duì)于那些經(jīng)驗(yàn)豐富的企業(yè)來(lái)說(shuō),產(chǎn)品經(jīng)理的作用依然占到34%,數(shù)據(jù)科學(xué)團(tuán)隊(duì)27%,幾乎與管理團(tuán)隊(duì)(28%)相同。
對(duì)那些缺乏經(jīng)驗(yàn)的企業(yè)而言,管理團(tuán)隊(duì)占到31%,數(shù)據(jù)科學(xué)團(tuán)隊(duì)占比較少(16%)。這不是個(gè)問(wèn)題,事實(shí)是這些數(shù)據(jù)科學(xué)團(tuán)隊(duì)最適合計(jì)算出如何使用數(shù)據(jù)并衡量其成功。
太多時(shí)候,是外行指導(dǎo)外行
這種依賴(lài)管理層來(lái)推動(dòng)數(shù)據(jù)科學(xué)的想法引起了人們的注意。調(diào)查顯示,不少高管自稱(chēng)是數(shù)據(jù)驅(qū)動(dòng)的,但卻無(wú)視了數(shù)據(jù)其實(shí)并不支持那些靠直覺(jué)驅(qū)使的決策(62%的人承認(rèn)這么做)。
那些缺乏大數(shù)據(jù)悟性的企業(yè)似乎愿意口頭提供數(shù)據(jù),但他們根本不明白有效數(shù)據(jù)科學(xué)的細(xì)微差別。他們?nèi)狈Ρ貍涞慕?jīng)驗(yàn)來(lái)確?梢垣@得有意義的、無(wú)偏見(jiàn)的數(shù)據(jù)洞察力。
關(guān)于如何理解機(jī)器學(xué)習(xí)模型,以及如何相信該模型所導(dǎo)致的結(jié)果,更多有成熟經(jīng)驗(yàn)的企業(yè)顯然掌握了Gartner博客網(wǎng)絡(luò)中的一位博主Andrew White的評(píng)估方法:
AI的創(chuàng)新之處就在于AI可以重新定義新的基線(xiàn),換句話(huà)說(shuō)就是那些我們認(rèn)為太過(guò)復(fù)雜的東西和非常規(guī)的東西,目前都可以利用AI來(lái)實(shí)現(xiàn)。和之前的技術(shù)相比,AI應(yīng)該可以處理更加復(fù)雜而且具有認(rèn)知能力的工作。
這個(gè)新的現(xiàn)實(shí)只有在AI自動(dòng)處理的結(jié)果是合理的時(shí)候才有意義。如果這個(gè)新奇的工具所得出的決策和結(jié)果讓人類(lèi)無(wú)法理解,那人們就會(huì)放棄這個(gè)工具。因此在某種程度上,能否理解AI所做出的決策也非常重要。
然而,理解決策和理解算法如何工作是兩回事。人是可以掌握輸入、選擇、權(quán)重以及結(jié)果的原理的,而即便算法能夠在一定程度上將所有這些結(jié)合到一起,但我們依然無(wú)法證明這一進(jìn)程。如果結(jié)果和輸入之間的差距太大,那么人對(duì)算法的信任就很有可能會(huì)喪失——這是人的天性。
想要達(dá)到這種理解水平是無(wú)法通過(guò)花錢(qián)雇傭咨詢(xún)顧問(wèn)能實(shí)現(xiàn)的。云端也不是現(xiàn)成的。運(yùn)用工具比如Google的AutoML可以“使得那些具有有限機(jī)器學(xué)習(xí)專(zhuān)長(zhǎng)經(jīng)驗(yàn)的開(kāi)發(fā)者能訓(xùn)練針對(duì)其業(yè)務(wù)需求的高質(zhì)量模型!边@聽(tīng)起來(lái)非常好,但是想要從數(shù)據(jù)科學(xué)中受益需要有數(shù)據(jù)科學(xué)的經(jīng)驗(yàn)。這不僅僅是調(diào)整模型的問(wèn)題,更需要知道如何實(shí)現(xiàn),這需要大量的試錯(cuò)經(jīng)驗(yàn)。
另外,從事數(shù)據(jù)科學(xué)需要有人文的心態(tài),再次強(qiáng)調(diào),需要經(jīng)驗(yàn)。沒(méi)有捷徑可循。實(shí)際上,這意味著那些早期投資于數(shù)據(jù)科學(xué)的企業(yè)應(yīng)該發(fā)現(xiàn)自己領(lǐng)先于那些沒(méi)有競(jìng)爭(zhēng)優(yōu)勢(shì)的同行——這種差異很可能會(huì)持續(xù)下去。
對(duì)于那些希望迎頭趕上的企業(yè),Gartner分析師Svetlana Sicular最為經(jīng)典的忠告仍然在耳邊回響:“企業(yè)應(yīng)該在內(nèi)部多看看。其實(shí)內(nèi)部已經(jīng)有人比那些神秘的數(shù)據(jù)科學(xué)家更了解自己的數(shù)據(jù)!敝灰髽I(yè)明白要在企業(yè)完成好的數(shù)據(jù)科學(xué)需要花費(fèi)時(shí)間,并且給予其人員學(xué)習(xí)和成長(zhǎng)的空間,他們就不再需要尋找捷徑。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
12月18日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線(xiàn)
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋(píng)果把身家押在Siri上:一場(chǎng)輸不起的自我革命
- 10 共探合作新機(jī)遇!江門(mén)市新會(huì)區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對(duì)接會(huì)成功舉辦