上海殺出超級獨角獸:用AI改造大數(shù)據(jù),全國第五
作者丨鉛筆道 松格
大數(shù)據(jù)與大模型結(jié)合,會擦出哪些火花?
最近,上海跑出一個超級獨角獸:星環(huán)信息,向港交所發(fā)起IPO沖刺。2022年,星環(huán)科技已在科創(chuàng)板上市。
它的主攻方向是:大數(shù)據(jù)基礎(chǔ)軟件。
星環(huán)科技主要解決幾大痛點
按照2024年的數(shù)據(jù),它是國內(nèi)最大的純AI基礎(chǔ)設(shè)施軟件提供商。同年,星環(huán)信入選了上海市重點服務(wù)已上市獨角獸企業(yè)榜單。
通過其在AI方向的實踐,我們可以總結(jié)大數(shù)據(jù)與AI的幾大機會。
1、用大模型降低開發(fā)成本。
例如,用戶可通過自然語言指令,構(gòu)建數(shù)據(jù)處理流程,無需復(fù)雜編碼。
2、用大模型增加檢索功能。
例如,某金融機構(gòu)利用 TKH 構(gòu)建專屬問答系統(tǒng),通過自然語言即可檢索歷史交易規(guī)則。
3、用大模型訓(xùn)練垂直大模型。
例如,在醫(yī)療行業(yè),客戶可基于 Sophon 對病歷文本、醫(yī)學(xué)影像等輔助疾病診斷。
4、用大模型賦能客戶業(yè)務(wù)。
在金融領(lǐng)域,基于大模型技術(shù)升級的解決方案可處理海量非結(jié)構(gòu)化數(shù)據(jù)。
- 01 -
星環(huán)科技創(chuàng)始人為孫元浩,1977年出生于江蘇常州,自幼便對編程展現(xiàn)出濃厚興趣。在南京大學(xué)計算機系完成了本科與研究生學(xué)習(xí)。2003年,26歲的孫元浩入職英特爾。
初入英特爾,孫元浩從技術(shù)人員做起,直到升職為數(shù)據(jù)中心軟件部亞太區(qū) CTO,成為英特爾 Hadoop 發(fā)行版的創(chuàng)始人。
2013年,他辭去英特爾的高薪職位創(chuàng)業(yè)(星環(huán)科技),瞄準自主可控的大數(shù)據(jù)基礎(chǔ)軟件。
創(chuàng)業(yè)初期,團隊規(guī)模不足 10 人,早期產(chǎn)品基于開源 Hadoop 產(chǎn)品構(gòu)建,隨后推出了核心產(chǎn)品 TDH(Transwarp Data Hub),類似大數(shù)據(jù)管理和處理的超級工具箱。
星環(huán)科技也積極布局人工智能領(lǐng)域。2018年推出一站式人工智能平臺 Sophon,該平臺集成了數(shù)據(jù)接入、清洗、標注、模型訓(xùn)練、管理及應(yīng)用部署等功能。
2022年10月18日,星環(huán)科技正式登陸上海證券交易所科創(chuàng)板,成為“國產(chǎn)大數(shù)據(jù)基礎(chǔ)軟件第一股”。
- 02 -
大數(shù)據(jù)軟件行業(yè)發(fā)展可劃分為幾個階段:
傳統(tǒng)數(shù)據(jù)庫時代:大致從 20 世紀 70 年代到 20 世紀末,以關(guān)系型數(shù)據(jù)庫與傳統(tǒng)數(shù)據(jù)倉庫為主體,偏向結(jié)構(gòu)化分析。
大數(shù)據(jù)時代:大約從 2000 年到 2012 年左右,伴隨云計算與海量數(shù)據(jù)興起,涌現(xiàn)大數(shù)據(jù)平臺、分布式計算框架與NoSQL系統(tǒng)。
AI基礎(chǔ)設(shè)施時代:一般認為從 2010 年代中后期開始,2022年加速火熱(大模型)。
AI、機器學(xué)習(xí)與大語言模型興起,推動行業(yè)向“數(shù)據(jù)→模型→應(yīng)用”閉環(huán)演進,強調(diào)底層AI運維平臺、知識圖譜與統(tǒng)一數(shù)據(jù)處理能力。
而這,也是星環(huán)科技正嘗試抓住的新機會:從“數(shù)據(jù)基礎(chǔ)設(shè)施”邁向“AI基礎(chǔ)設(shè)施”。通過它在AI方向的實踐,我們或許可以看出,AI正與大數(shù)據(jù)擦出哪些火花?
- 03 -
星環(huán)在AI方向的探索,可以總結(jié)為幾個方面。
1、用大模型降低開發(fā)成本。
例如,用戶可通過自然語言指令,構(gòu)建數(shù)據(jù)處理流程,無需復(fù)雜編碼。
以前處理數(shù)據(jù)像組裝家具,得一步步按固定步驟拼(寫代碼),現(xiàn)在有了大模型,你可以跟“智能顧問” 說句話(組裝一個怎樣的家具),顧問就能幫你把書架拼好。
2、用大模型增加檢索功能。
例如,某金融機構(gòu)利用 TKH 構(gòu)建專屬問答系統(tǒng),通過自然語言即可檢索歷史交易規(guī)則。
3、用大模型訓(xùn)練垂直大模型。
例如,在醫(yī)療行業(yè),客戶可基于 Sophon 對病歷文本、醫(yī)學(xué)影像等非結(jié)構(gòu)化數(shù)據(jù)進行聯(lián)合分析,輔助疾病診斷,突破了傳統(tǒng)機器學(xué)習(xí)模型僅能處理結(jié)構(gòu)化數(shù)據(jù)的局限。
4、用大模型賦能客戶業(yè)務(wù)。
在金融領(lǐng)域,基于大模型技術(shù)升級的解決方案可處理海量非結(jié)構(gòu)化數(shù)據(jù)。
例如,某銀行利用其分析新聞輿情、研報文本等數(shù)據(jù),通過大模型提取關(guān)鍵信息并生成風(fēng)險預(yù)警,輔助信貸決策。
- 04 -
根據(jù)沙利文數(shù)據(jù),中國大數(shù)據(jù)軟件市場規(guī)模預(yù)計在 2024 年達到 492 億元,2019 - 2024 年復(fù)合增長率為 27.5%。
在競爭格局上,國際上甲骨文(Oracle)、微軟Azure、AWS等提供成熟的AI與數(shù)據(jù)庫服務(wù);相較而言,國內(nèi)企業(yè)在AI基礎(chǔ)設(shè)施領(lǐng)域起步較晚但成長迅速,與國際巨頭仍有差距。
國內(nèi)AI基礎(chǔ)設(shè)施軟件尚未形成絕對CR5壟斷格局,市場集中度較低,但領(lǐng)先企業(yè)如華為云、阿里云、大廠平臺提供底層服務(wù)。初創(chuàng)企業(yè)在細分市場(如知識圖譜、大模型運維)等展開競爭。
據(jù)弗若斯特沙利文數(shù)據(jù),2024 年在中國 AI 基礎(chǔ)設(shè)施軟件市場,星環(huán)科技排名第五,同時是最大的純軟件服務(wù)商。
財務(wù)數(shù)據(jù)顯示,2022 年營收 3.73 億元,虧損 2.72 億元;2023 年營收增至 4.91 億元,虧損收窄至 2.89 億元;2024 年營收回落至 3.71 億元,虧損擴大至 3.44 億元。
本文不構(gòu)成任何投資建議。
原文標題 : 上海殺出超級獨角獸:用AI改造大數(shù)據(jù),全國第五

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字