數(shù)據(jù)科學(xué)50年,數(shù)據(jù)科學(xué)家是否依然是21世紀(jì)最性感的職業(yè)?
在如今的數(shù)據(jù)智能時(shí)代,幾乎所有人都相信“數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而絕大部分則隱藏在表面之下。”當(dāng)數(shù)據(jù)的價(jià)值依然在冰山之下隱藏,外面的世界便彌漫著對(duì)數(shù)據(jù)的渴望。
一些新的職業(yè)成為數(shù)據(jù)海洋里的新星,“數(shù)據(jù)科學(xué)家”無(wú)疑是最亮的之一,它被譽(yù)為21世紀(jì)最性感的職業(yè),但是近年來(lái)隨著平民數(shù)據(jù)科學(xué)家的發(fā)展,有人指出數(shù)據(jù)科學(xué)家將要消失,也有國(guó)外相關(guān)人士建議不要去選數(shù)據(jù)科學(xué)家這個(gè)職業(yè),數(shù)據(jù)科學(xué)家還是21世紀(jì)最性感的職業(yè)嗎?
數(shù)據(jù)科學(xué)五十年仍是少年
數(shù)據(jù)科學(xué)家泛指數(shù)據(jù)科學(xué)的從業(yè)者,追溯數(shù)據(jù)科學(xué)家的源頭可以到數(shù)據(jù)科學(xué)誕生的1966年,當(dāng)時(shí)Peter Naur提出"數(shù)據(jù)科學(xué)"(“DataScience”起初叫"datalogy "),用來(lái)代替"計(jì)算機(jī)科學(xué)"。1996年,International Federation of Classification Societies (IFCS)國(guó)際會(huì)議召開(kāi)。數(shù)據(jù)科學(xué)一詞首次出現(xiàn)在會(huì)議(Data Science, classification, and related methods)標(biāo)題里。
在2000年代中期數(shù)據(jù)科學(xué)家職位開(kāi)始出現(xiàn),2009年Natahn Yau指出數(shù)據(jù)科學(xué)家是是采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具尋找新的數(shù)據(jù)洞察的工程師,數(shù)據(jù)科學(xué)家集技術(shù)專(zhuān)家與數(shù)量分析師的角色于一身。
實(shí)際上大數(shù)據(jù)和數(shù)據(jù)科學(xué)在內(nèi)的整個(gè)數(shù)據(jù)行業(yè)最初都是由Google、Facebook、Twitter等互聯(lián)網(wǎng)巨頭驅(qū)動(dòng),現(xiàn)在仍然如此。總部位于歐洲的JetBrains是國(guó)際知名軟件開(kāi)發(fā)工具提供商,其產(chǎn)品經(jīng)理Andrey Cheptsov認(rèn)為互聯(lián)網(wǎng)巨頭能夠推動(dòng)數(shù)據(jù)行業(yè)的發(fā)展首先有所需求、并有能力進(jìn)行大規(guī)模有效處理數(shù)據(jù),其主要業(yè)務(wù)模型從核心上取決于自身處理大規(guī)模數(shù)據(jù)的效率。
隨著大數(shù)據(jù)行業(yè)的發(fā)展,數(shù)據(jù)科學(xué)家成為了職場(chǎng)新星,更是被財(cái)富雜志譽(yù)為21世紀(jì)最性感的職業(yè)。但是數(shù)據(jù)科學(xué)家在初期成長(zhǎng)也并非一帆風(fēng)順,根據(jù)商業(yè)智能公司SiSense在2012 年左右的一項(xiàng)報(bào)告,在接受調(diào)查的全球400位數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析人士中,59%的數(shù)據(jù)科學(xué)家在從業(yè)六年后都另謀高就。盡管該職業(yè)的報(bào)酬豐厚,其中超過(guò)半數(shù)表示對(duì)職業(yè)安全性的擔(dān)憂(yōu)。
彼時(shí)麥肯錫等咨詢(xún)公司力挺數(shù)據(jù)科學(xué)家,堅(jiān)信數(shù)據(jù)科學(xué)家是當(dāng)今和未來(lái)稀缺的資源。隨著智能手機(jī)的普及移動(dòng)互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)價(jià)值越發(fā)凸顯,數(shù)據(jù)科學(xué)家水漲船高。LinkedIn 發(fā)布的《2017 年美國(guó)新興工作崗位報(bào)告》中指出,“自 2012 年以來(lái),數(shù)據(jù)科學(xué)家的職位增長(zhǎng)了 650% 以上”且“數(shù)百家企業(yè)都在招聘這些職位”。
國(guó)內(nèi)近幾年也有互聯(lián)網(wǎng)公司近幾年開(kāi)始逐步設(shè)立獨(dú)立的數(shù)據(jù)科學(xué)(DataScience)團(tuán)隊(duì),推動(dòng)公司向數(shù)據(jù)驅(qū)動(dòng)發(fā)展。進(jìn)入21世紀(jì)20年代,數(shù)據(jù)科學(xué)家成為更稀缺的資源,很多人也依然相信它還是21世紀(jì)最性感的職業(yè)。
不過(guò)榮譽(yù)傍身的新星也有“暗淡”的一面,2017年有研究指出數(shù)據(jù)科學(xué)家成為離職率最高的職位之一,通常他們每周都會(huì)花費(fèi)一定的時(shí)間尋找新工作。日前仍然有數(shù)據(jù)科學(xué)家從業(yè)者勸諫后來(lái)者不要入坑,可謂是冰火兩重天,何以至此?
數(shù)據(jù)科學(xué)五十年依舊是少年模樣,就如同“AI”這個(gè)名詞在1956年出現(xiàn)到如今60多年才有初步落地,數(shù)據(jù)科學(xué)是一個(gè)綜合性的學(xué)科,國(guó)內(nèi)外很多從業(yè)者認(rèn)為數(shù)據(jù)科學(xué)依然是探索性的工作,管理層對(duì) “數(shù)據(jù)科學(xué)” 的含義往往沒(méi)有達(dá)成共識(shí)。
雖然已經(jīng)經(jīng)過(guò)至少10多年的發(fā)展,現(xiàn)在可能受限于業(yè)務(wù),沒(méi)有辦法生搬硬套一個(gè)角色框架給數(shù)據(jù)科學(xué)家,企業(yè)也容易將數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師混淆。JetBrains產(chǎn)品經(jīng)理Maria Khalusova認(rèn)為“數(shù)據(jù)科學(xué)家”和“數(shù)據(jù)工程師”這兩種職位角色在行業(yè)中還是相當(dāng)新的,也正因此,通常沒(méi)有明確的職責(zé)劃分。“我們看到在某些公司中由數(shù)據(jù)科學(xué)家承擔(dān)的職責(zé),在其他公司中這些職責(zé)卻由數(shù)據(jù)工程師承擔(dān)。另一個(gè)越來(lái)越常見(jiàn)的新角色是機(jī)器學(xué)習(xí)工程師,但也是同樣的情況,他們也經(jīng)常與數(shù)據(jù)工程師發(fā)生重疊。”Maria Khalusova在接受IT168采訪(fǎng)時(shí)指出。
數(shù)據(jù)科學(xué)家VS數(shù)據(jù)工程師
新的技術(shù)融入產(chǎn)業(yè)和社會(huì)必然會(huì)帶來(lái)一場(chǎng)職業(yè)的辭舊迎新,這個(gè)過(guò)程并沒(méi)有那么快速。
“從技術(shù)角度來(lái)看,數(shù)據(jù)科學(xué)在某些情況下的實(shí)踐似乎還不如傳統(tǒng)軟件開(kāi)發(fā)成熟。企業(yè)可能會(huì)面臨以下挑戰(zhàn):建立可重現(xiàn)的機(jī)器學(xué)習(xí)管道,對(duì)數(shù)據(jù)和模型進(jìn)行版本控制以進(jìn)行審核,與快速發(fā)展的技術(shù)保持同步!盡aria Khalusova指出。
數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的角色兩者有許多共同的特點(diǎn)和共技能。這些重疊的技能包括處理和操作大數(shù)據(jù)集、應(yīng)用數(shù)據(jù)的編程技能、數(shù)據(jù)分析技能以及對(duì)系統(tǒng)操作的總體熟練程度。不過(guò)兩者還是有很大的不同。在筆者之前翻譯的文章中也強(qiáng)調(diào)了數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師不可能合二為一,為了從數(shù)據(jù)中獲得價(jià)值,大多數(shù)企業(yè)組織都需要數(shù)據(jù)科學(xué)和數(shù)據(jù)工程,由于相關(guān)技能有很大差異,二者合體也不太現(xiàn)實(shí)。企業(yè)組織可能需要多個(gè)數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,但兩者之間的比例很少是1:1。對(duì)于大多數(shù)企業(yè)組織來(lái)說(shuō),擁有更多的數(shù)據(jù)工程師比數(shù)據(jù)科學(xué)家更有意義。因?yàn)閿?shù)據(jù)科學(xué)家已經(jīng)學(xué)會(huì)處理大量的干凈數(shù)據(jù),但是從許多不同系統(tǒng)獲得大量的干凈數(shù)據(jù)更難也更具挑戰(zhàn)。與抽象數(shù)據(jù)模型和對(duì)數(shù)據(jù)集運(yùn)行分析相比,移動(dòng)和清理數(shù)據(jù)的工作量更大。
從技能需求方面也有很大的差異,Maria Khalusova認(rèn)為,廣義上來(lái)講,數(shù)據(jù)工程師通常必須熟悉那些為分布式數(shù)據(jù)處理而設(shè)計(jì)的工具,例如Apache Spark、Apache Hadoop、Apache Ignite等。他們要具備數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖方面的經(jīng)驗(yàn),因?yàn)樗麄冃枰軌蚴炀毜厥褂肑ava、Scala和Kotlin等JVM語(yǔ)言,并且必須能夠創(chuàng)建和維護(hù)大多數(shù)數(shù)據(jù)基礎(chǔ)架構(gòu)。

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線(xiàn)會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線(xiàn)下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠(chǎng)展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 7 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線(xiàn)機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)