Databricks 崛起啟示錄
新眸大公司研究組作品
作者|葉靜
編輯|桑明強(qiáng)
在數(shù)據(jù)庫領(lǐng)域,如果問當(dāng)下誰最火,那Databricks一定排得上號。
去年8月,距離10億美元的G輪融資剛過去7個月,Databricks再次獲得16億美元H輪融資,身價搖身一變成380億美元,成為外界一致認(rèn)為的超級獨(dú)角獸。一直以來,數(shù)據(jù)領(lǐng)域備受關(guān)注,如果從2007年開始計(jì)算,全球的數(shù)據(jù)量至今已經(jīng)膨脹了近200倍,數(shù)字化被寫入戰(zhàn)略規(guī)劃成了各類行業(yè)的共識。
在數(shù)據(jù)量井噴的背景下,上云趨勢也越來越明確,以Snowflake、Databricks為代表的大數(shù)據(jù)公司應(yīng)運(yùn)而生,前者基于AmazonS3打造了云端的數(shù)據(jù)倉庫,后者除了推出Lakehouse(湖倉一體),現(xiàn)在又押寶機(jī)器學(xué)習(xí),試圖包管數(shù)據(jù)在抵達(dá)機(jī)器學(xué)習(xí)之前的所有流程。
不同的是,Databricks已經(jīng)從原來的infra向更廣泛場景延伸,和昔日的伙伴Snowflake同臺競技。與此同時,以AWS為代表的云巨頭,也都曾戰(zhàn)略性投資過Databricks,但現(xiàn)在也都在自研數(shù)據(jù)分析套件,競合關(guān)系漸趨白熱化,讓數(shù)據(jù)基礎(chǔ)設(shè)施的戰(zhàn)火撲朔迷離。
01從0到1
企業(yè)的性格往往被它的創(chuàng)始人和技術(shù)背景所決定。
十幾年前在UC Berkley的AI實(shí)驗(yàn)室里,Ghodsi和伙伴發(fā)起Spark項(xiàng)目:做一個能夠更輕松處理大量數(shù)據(jù)和機(jī)器算法的引擎,并且開源了代碼。相比較多數(shù)開源項(xiàng)目,面向的都是底層技術(shù)性強(qiáng)要求的infra工程師,spark面向更廣泛的客戶群,同時在上層加了很多的新的API,降低了技術(shù)門檻。
因?yàn)闆]有優(yōu)秀的開發(fā)者社區(qū)運(yùn)營和推廣團(tuán)隊(duì),Spark變現(xiàn)比較難,之后團(tuán)隊(duì)成員決定成立Databricks,以商業(yè)化方式推動Spark社區(qū)發(fā)展。即便Spark是過去硅谷的頂流產(chǎn)品,但這并沒有讓AWS等巨頭買賬,他們選擇繞過Databricks,直接將Spark集成到自己的產(chǎn)品里。在Databricks賣產(chǎn)品還不如辦Spark峰會收入高的時候,Amazon EMR已經(jīng)針對Spark實(shí)現(xiàn)了幾億營收。
Databricks創(chuàng)始團(tuán)隊(duì)走了一條不被大眾熟知的激進(jìn)的路:云。
雖然不管對公司還是客戶來說,云可以更快部署,也更容易維護(hù),但正如聯(lián)合創(chuàng)始人Reynold Xin所說,大部分的人知道云是未來,但絕不是現(xiàn)在。當(dāng)時只有小部分風(fēng)投注資這家初創(chuàng)企業(yè),New Enterprise Associates的投資者Pete Sonsini說:“我們在Databricks的軟件收入為零時投資,認(rèn)為他們會在大流行中加速發(fā)展,也許是一兩個月,每個人都無法及時知道會發(fā)生什么”。和Databricks一樣,他們也在賭未來。
圖:Databricks年度融資及估值變動
2013到2015這三年,雖然有硅谷風(fēng)投支持,Databricks也借力這些資金吸引人才,推出了基于云端的簡化大數(shù)據(jù)處理平臺Databricks Cloud,但不管是招主管、找融資還是見客戶,Databricks都會被質(zhì)疑:真的不支持on-prem嗎?
因?yàn)楸晨縎park,很多客戶甚至愿意年付幾千萬美金讓Databricks提供咨詢定制化項(xiàng)目,但Databricks做的是一個給數(shù)據(jù)工程師的平臺,這是當(dāng)時大部分公司聞所未聞的玩法,也是前幾年商途不順的原因之一。值得一提的是,彼時的云界開源前輩Cloudera曾改名“Cloud Era”,可在當(dāng)時的市場情況下,最終還是轉(zhuǎn)向了on-prem做定制和售后支持才得以存活。
在這種邏輯下,云廠商把開源軟件拿來經(jīng)過簡單的封裝,再作為服務(wù)賣出去。由于這個過程只需要簡單的部署和調(diào)試,工程成本極低,定價也不高,巨頭從中賺走了大部分,這對Databricks來說相當(dāng)于吸血,怎樣和有錢有人的云巨頭對抗,是Databricks亟需在技術(shù)上打造的壁壘。
他們賭的另一條路,是不做數(shù)倉。
彼時數(shù)據(jù)倉庫競爭過于激烈,以亞馬遜為首的巨頭占據(jù)了大部分市場份額,Databricks繼續(xù)小眾打法:避開紅海,嘗試切入一個新興卻可能會有爆炸性增長的小市場,針對數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和AI的方向做產(chǎn)品。
開源小公司的優(yōu)勢在于更懂項(xiàng)目,迭代更快,能夠聚焦、死磕產(chǎn)品性能,而公有云大廠很難在單一方向投入最好的工程師。隨著數(shù)據(jù)量的爆發(fā),云的生態(tài)優(yōu)勢逐漸被認(rèn)可,加上當(dāng)時市面上也沒有大量競品,這給Databricks的產(chǎn)品帶來了機(jī)會。
另一方面,在2019年微軟投資Databricks之前,正巧CEO納德拉推動云為先的戰(zhàn)略,兩家合作的Azure Databricks進(jìn)入了微軟的企業(yè)許可協(xié)議。微軟從一個大數(shù)據(jù)競爭劣勢的云產(chǎn)品搖身成為業(yè)界領(lǐng)先,形成了云巨頭三足鼎立的局面;因?yàn)閹缀跛写笃髽I(yè)都和微軟有ELA,共生效應(yīng)之下,客戶原本買云買Office的預(yù)算自然流向了Databricks。
有人將Databricks創(chuàng)始團(tuán)隊(duì)比作一群幸運(yùn)的加州嬉皮士RD,他們信仰技術(shù),信仰來源,信仰共享和長期主義,這些也都成為了Databricks的底色。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報(bào)名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機(jī)會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 騰訊米哈游押寶的中國AI應(yīng)用,正在海外悶聲發(fā)財(cái)