趨勢丨離線+記憶,離線大模型將成下一代通用人工智能的基石
前言:
在數(shù)字化時代,大模型技術(shù)正以前所未有的速度改變,成為推動各行業(yè)變革的核心力量。
2025年,大模型領(lǐng)域迎來了新一輪的爆發(fā)式增長與結(jié)構(gòu)性優(yōu)化,從技術(shù)突破到商業(yè)應(yīng)用,從市場競爭到產(chǎn)業(yè)生態(tài)構(gòu)建,都呈現(xiàn)出令人矚目的新態(tài)勢,尤其是在今年的世界人工智能大會(WAIC)上,離線大模型成為了備受關(guān)注的焦點之一。
作者 | 方文三
圖片來源 | 網(wǎng) 絡(luò)
多模態(tài)融合,拓展感知邊界
2025年上半年,大模型在多模態(tài)技術(shù)上取得了重大突破,實現(xiàn)了從單一文本交互到“圖文音視頻”全模態(tài)融合的跨越。
這一進(jìn)展使得大模型能夠更全面、準(zhǔn)確地理解和處理信息,為用戶提供更加豐富、直觀的交互體驗。
Gartner預(yù)計,到2027年,40%的生成式AI解決方案將采用多模態(tài)技術(shù),較2023年的1%顯著提升。
在國內(nèi),火山引擎于今年6月發(fā)布豆包大模型1.6、視頻生成模型Seedance1.0pro等新模型,其中豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,讓用戶能夠通過圖像、語音等多種方式與模型進(jìn)行交互,極大地拓展了應(yīng)用場景。
商湯日日新大模型從1月推出原生融合模態(tài)版本,到4月升級V6實現(xiàn)多模態(tài)推理突破,不斷迭代技術(shù),提升模型的多模態(tài)處理能力。
快手可靈AI構(gòu)建多模態(tài)創(chuàng)意生產(chǎn)力平臺,上線一年多以來,已累計生成1.68億個視頻和3.44億張圖片,為內(nèi)容創(chuàng)作領(lǐng)域帶來了新的活力。
離線大模型,獨立運行與記憶革新
在大模型技術(shù)蓬勃發(fā)展的當(dāng)下,離線大模型憑借獨特優(yōu)勢成為行業(yè)新焦點。
其最大特點是能在無網(wǎng)絡(luò)連接的情況下獨立運行,這有效規(guī)避了網(wǎng)絡(luò)不穩(wěn)定或斷網(wǎng)導(dǎo)致的服務(wù)中斷問題。
在野外探險、偏遠(yuǎn)地區(qū)作業(yè)以及網(wǎng)絡(luò)信號差的場所,離線大模型設(shè)備能穩(wěn)定提供智能服務(wù)。
從技術(shù)層面來看,離線大模型實現(xiàn)了模型的本地化部署,數(shù)據(jù)處理和計算都在本地設(shè)備完成,極大提升了隱私安全性。
像醫(yī)療、金融等對數(shù)據(jù)保密性要求極高的行業(yè),使用離線大模型可確保敏感數(shù)據(jù)不出本地,降低數(shù)據(jù)泄露風(fēng)險。
今年WAIC上,諸多企業(yè)展示新成果
RockAI推出的最新版非Transformer架構(gòu)大模型Yan 2.0 Preview,在離線和記憶功能方面表現(xiàn)亮眼。
它打破傳統(tǒng),將離線大模型部署邊界下探到“千元機(jī)”級別,讓低配置設(shè)備也能實現(xiàn)離線實時AI運算。
新增的“記憶模塊”是一大突破,如同人類大腦海馬體,能存儲學(xué)習(xí)過程中的關(guān)鍵信息并在新場景快速調(diào)用。
現(xiàn)場演示中,搭載該模型的機(jī)器狗,無需預(yù)設(shè)程序,通過記憶模塊學(xué)習(xí)工作人員展示的自定義新動作后成功執(zhí)行,這種持續(xù)進(jìn)化和自主決策能力,是傳統(tǒng)大模型難以企及的。
Google DeepMind推出的Gemini Robotics On-Device模型也備受矚目,作為專為雙臂機(jī)器人設(shè)計的VLA基礎(chǔ)模型,它能直接解析自然語言指令并驅(qū)動機(jī)器人執(zhí)行相應(yīng)動作。
核心優(yōu)勢在于能在機(jī)器人本地離線運行,同時處理視覺識別、語言理解與動作執(zhí)行任務(wù),在醫(yī)療操作、災(zāi)難救援、工廠自動化等對實時性和穩(wěn)定性要求高的場景中,有效避免了云端傳輸?shù)难舆t和潛在風(fēng)險。
另外,谷歌開源的AI Edge Gallery,允許用戶在手機(jī)上本地運行大模型,完全離線且免費,支持從Hugging Face下載各種大模型,實現(xiàn)不聯(lián)網(wǎng)狀態(tài)下的聊天、識圖、代碼生成和文本推理等功能,滿足了用戶在隱私保護(hù)、本地算力利用以及弱網(wǎng)環(huán)境下使用AI的需求 。
英特爾展示的基于本地的大語言模型采用三合一模型,可離線運行。中文語料庫搭載62億參數(shù)的GIM2 - 6B模型,擁有32K的上下文支持能力,通過超1.4萬億的英文和中文令牌進(jìn)行預(yù)訓(xùn)練,模型性能和推理能力較強(qiáng)。
還本地化部署了專門處理編程語言的starcolder - 15.5B模型,方便程序員在離線環(huán)境下進(jìn)行代碼生成和理解 。
這些企業(yè)的成果展示,不僅體現(xiàn)了離線大模型在技術(shù)上的創(chuàng)新突破,也預(yù)示著其在未來智能設(shè)備、工業(yè)生產(chǎn)、個人隱私保護(hù)等多領(lǐng)域的廣闊應(yīng)用前景。
結(jié)尾:智能的“最后一公里”,我們準(zhǔn)備好了嗎?
當(dāng)一個擁有自主行動能力的智能體,可以在我們的物理世界中離線活動時,它所帶來的想象空間是巨大的。從能夠照顧老人的家庭伴侶,到可以進(jìn)行精細(xì)操作的外科手術(shù)助手,再到能夠深入險境的救援隊員,機(jī)器人的應(yīng)用邊界被前所未有地拓寬了。
然而,這也帶來了新的思考。當(dāng)機(jī)器的決策過程完全在本地完成,變得不再那么透明和可控時,我們?nèi)绾未_保其行為的安全性與可靠性?當(dāng)一個機(jī)器人能夠在沒有外部監(jiān)督的情況下自主學(xué)習(xí)和行動,我們又該如何界定責(zé)任的邊界?
Google DeepMind實驗室的這一步,無疑是邁向通用人工智能的重要一步,它叩響了物理世界智能化的大門。但這扇門背后,既有前所未見的機(jī)遇,也有需要我們審慎面對的挑戰(zhàn)。這不僅僅是工程師和科學(xué)家的議題,更是我們每一個人都需要開始思考的未來。
內(nèi)容來源于:
36氪:離線+記憶,大模型進(jìn)化的分水嶺
尕燚龍科技茶館:Google機(jī)器人離線模型,從“云端智者”走向“地面實干家”
醫(yī)械筆記本:斷網(wǎng)沒關(guān)系,谷歌發(fā)布具身智能離線模型,可本地化部署
原文標(biāo)題 : AI芯天下丨趨勢丨離線+記憶,離線大模型將成下一代通用人工智能的基石

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
精彩回顧立即查看>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 2 黃仁勛:與雷軍長期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化
- 5 六大國產(chǎn)大模型,誰是最強(qiáng)“金融分析師”?|錦緞評測
- 6 2025年第一支10倍股,來了!
- 7 募資39.85億元!寒武紀(jì)押注大模型芯片與軟件平臺
- 8 國內(nèi)免費版Deep Research上線,秘塔AI深度研究嘗試重塑知識工作范式
- 9 清庫存?曝英偉達(dá)H20供應(yīng)有限,且沒有復(fù)產(chǎn)計劃
- 10 賈躍亭再獲 7.5 億元融資,用于新車FF 91 生產(chǎn)交付