說不盡的“百模”大戰(zhàn)
今年以來,我國大模型產業(yè)駛入“百模”大戰(zhàn)時代,賽道熱度空前,大戰(zhàn)愈演愈烈。在本月初舉行的2023全球數(shù)字經濟大會人工智能高峰論壇上,北京市經濟和信息化局黨組書記、局長姜廣智表示,現(xiàn)在全國已有80余個大模型公開發(fā)布。
“百模”
“百模”實則大模型產業(yè)領域中各家企業(yè)發(fā)布的大模型,目前,大模型及其產品主要分為三類。第一類是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大訊飛的‘星火’等都屬于通用大模型;第二類是行業(yè)大模型;第三類是基于通用大模型或行業(yè)大模型的應用型服務。目前已經發(fā)布的產品大多集中在第一類和第二類。
從全球已經發(fā)布的大模型分布來看,中美兩國數(shù)量合計占全球總數(shù)的超 80%。有專家披露,據(jù)不完全統(tǒng)計,目前中國 10 億參數(shù)規(guī)模以上的大模型已發(fā)布 79 個。那么,國內又有哪些大模型?
華為:盤古大模型
7月7日-9日,盤古大模型3.0在華為開發(fā)者大會2023上正式發(fā)布,由 5+N+X 三層架構組成。
L0 基礎大模型:包含五個基礎大模型:中文語言(NLP)大模型、視覺(CV)大模型、多模態(tài)大模型、科學計算大模型和圖網絡(Graph)大模型。
L1 行業(yè)大模型:涵蓋N 個行業(yè)大模型,已推出了盤古金融大模型、盤古礦山大模型、盤古氣象大模型、盤古電力大模型、盤古制造質檢大模型、盤古藥物分子大模型等行業(yè)大模型。
L2 場景模型:為客戶提供更多細化場景,它更加專注于某個具體的應用場景或特定業(yè)務,為客戶提供開箱即用的模型服務。例如基于氣象大模型的短臨氣象預報、臺風預測等場景模型;基于電力大模型的無人機電力巡檢、電力缺陷識別等場景模型;基于時尚大模型的時尚輔助設計、時尚版權保護等場景模型。
截至目前,盤古大模型已深入金融、制造、政務、電力、煤礦、醫(yī)療、鐵路等 10 多個行業(yè),支撐起 400 多個 AI 業(yè)務場景的應用落地。
百度:文心一言
2月7日,百度正式宣布推出文心一言(ERNIE Bot),文心一言是基于文心大模型技術推出的生成式對話產品,底層技術基礎是文心大模型,底層邏輯是通過百度智能云提供服務,吸引企業(yè)和機構客戶使用API和基礎設施,共同搭建AI模型、開發(fā)應用,實現(xiàn)產業(yè)AI普惠。
文心大模型包括NLP大模型、CV大模型、跨模態(tài)大模型、生物計算大模型、行業(yè)大模型。目前,文心大模型已經迭代至3.5版本,與3.0版本相比,訓練速度提升了2倍,推理速度提升了17倍,模型效果累計提升超過50%。
據(jù)百度官方表示,文心一言大模型的訓練數(shù)據(jù)包括了萬億級網頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調用數(shù)據(jù),以及5500億事實的知識圖譜等。
騰訊:混元大模型
基于騰訊強大的底層算力和低成本的高速網絡基礎設施,2022 年底騰訊發(fā)布了低成本、可落地的NLP萬億大模型——混元(HunYuan)AI 大模型。
混元AI大模型采用騰訊太極機器學習平臺自研的訓練框架AngelPTM,相比業(yè)界主流的解決方案,太極AngelPTM單機可容納的模型可達55B,20個節(jié)點(A100-40Gx8)可容納萬億規(guī)模模型,節(jié)省45%訓練資源,并在此基礎上訓練速度提升1倍。
在模型層,混元大模型完整覆蓋 NLP 大模型、 CV 大模型、多模態(tài)大模型、文生圖大模型及眾多行業(yè)、領域、任務模型。其中,HunYuan-NLP 1T 的模型能力在自然語言理解任務榜單 CLUE 中登頂。
在產業(yè)化方面,混元先后支持了包括微信、QQ、游戲、騰訊廣告、騰訊云等眾多產品和業(yè)務,通過 NLP、CV、跨模態(tài)等 AI 大模型,不僅為業(yè)務創(chuàng)造了增量價值而且降低了使用成本。特別是其在廣告內容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的應用,在為騰訊廣告帶來大幅 GMV 提升的同時,也初步驗證了大模型的商業(yè)化潛力。
阿里:通義千問
2022年9月,在阿里巴巴達摩院主辦的世界人工智能大會“大規(guī)模預訓練模型”主題論壇上,達摩院副院長周靖人發(fā)布阿里巴巴“通義”大模型系列,并宣布相關核心模型向全球開發(fā)者開源開放。
通義大模型打造了業(yè)界首個AI(人工智能)統(tǒng)一底座,在業(yè)界首次實現(xiàn)模態(tài)表示、任務表示、模型結構的統(tǒng)一。以統(tǒng)一底座為基礎,達摩院構建了層次化的模型體系,其中通用模型層覆蓋自然語言處理、多模態(tài)、計算機視覺,專業(yè)模型層深入電商、醫(yī)療、法律、金融、娛樂等行業(yè)。
目前,通義大模型系列已在超過200個場景中提供服務,實現(xiàn)了2%~10%的應用效果提升。典型使用場景包括電商跨模態(tài)搜索、AI輔助設計、開放域人機對話、法律文書學習、醫(yī)療文本理解等。
京東:言犀大模型
7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東云峰會上推出。與通用大模型相比,靈犀大模型融合70%通用數(shù)據(jù)與30%數(shù)智供應鏈原生數(shù)據(jù),具有“更高產業(yè)屬性、更強泛化能力、更多安全保障”的優(yōu)勢。
同時,京東還推出了一套大模型的完整工具,包括支撐大模型研發(fā)的基礎設施——言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫、混合多云操作系統(tǒng)云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產品。
該模型的落地應用路線圖“125”計劃也已公布,包括一個平臺、兩個領域和五個應用。其中,一個平臺為ChatJD智能人機對話平臺,兩個領域為零售和金融,五個應用則包括內容生成、人機對話、用戶意圖理解、信息抽取和情感分類。
360:360智腦大模型
6月13日,360集團正式召開“360智腦大模型”應用發(fā)布會,發(fā)布認知型通用大模型“360智腦4.0”,并宣布360智腦已經接入360旗下產品“全家桶”中。
據(jù)介紹,本次發(fā)布的“智腦大模型”已經具備四大核心能力,包括文字處理能力、圖像處理能力、語音處理能力以及視頻處理能力,可實現(xiàn)文生文、文生圖、文生表、圖生圖、圖生文、視頻理解等功能。
360選擇了大而全路線,對標微軟的全家桶。當前,360智腦已具備生成與創(chuàng)作、多輪對話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態(tài)、翻譯等十大核心能力,維度涵蓋數(shù)百項細分功能。
科大訊飛:星火認知大模型
5月6日,科大訊飛星火認知大模型正式發(fā)布,涵蓋了文本生成、語言理解、知識問答、邏輯推理等七項核心能力,并持續(xù)迭代于6月9日再次升級發(fā)布星火認知大模型V1.5。
目前,科大訊飛圍繞星火認知大模型,以一平臺 + 多賽道的“1+N”模式,將業(yè)務范圍延展到包括開放平臺、智慧教育、智慧醫(yī)療、智慧城市、運營商在內的多個領域。其中,“1”是指以通用認知智能大模型算法研發(fā)及高效訓練底座平臺,“N”則是針對于多個行業(yè)領域的專用大模型版本,其中,包含教育、醫(yī)療、汽車、人機交互、辦公、翻譯、工業(yè)等。
所有產品都值得用大模型重做一遍
“所有產品都值得用大模型重做一遍。”在2023年阿里云峰會上,阿里巴巴集團董事會主席兼CEO張勇說道。
放到應用層面來理解,玩家都期待借著這個風口,把自家產品包裝一下再重新推廣出去。所以,目前各家的大模型都與本身業(yè)務類型相關。這也就說明,目前國內的“百模”大戰(zhàn),大模型的內卷仍是互聯(lián)網企業(yè)主流業(yè)務的競爭。
小結:
大模型產業(yè)是未來科技競爭的關鍵較量之一。有些專家認為,聚焦細分領域有可能讓成本降低,讓大模型在領域落地和成本優(yōu)化方面進展更快才能真正普惠更多用戶。
有些專家對此持相反觀點,認為:細分行業(yè)只存在于“中模型”,不存在于”大模型“,只有覆蓋多個行業(yè)、通用才叫大模型,畢竟“百模大戰(zhàn)”最終拼的是場景落地能力。
如何率先突圍,仍然需要時間的檢驗。
原文標題 : 資本 | 說不盡的“百模”大戰(zhàn)

請輸入評論內容...
請輸入評論/評論長度6~500個字