訂閱
糾錯
加入自媒體

趨勢丨離線+記憶,離線大模型將成下一代通用人工智能的基石

前言

在數(shù)字化時代,大模型技術(shù)正以前所未有的速度改變,成為推動各行業(yè)變革的核心力量。 

2025年,大模型領(lǐng)域迎來了新一輪的爆發(fā)式增長與結(jié)構(gòu)性優(yōu)化,從技術(shù)突破到商業(yè)應(yīng)用,從市場競爭到產(chǎn)業(yè)生態(tài)構(gòu)建,都呈現(xiàn)出令人矚目的新態(tài)勢,尤其是在今年的世界人工智能大會(WAIC)上,離線大模型成為了備受關(guān)注的焦點之一。 

作者 | 方文三

圖片來源 |  網(wǎng) 絡(luò) 

 

圖片

 

多模態(tài)融合,拓展感知邊界 

2025年上半年,大模型在多模態(tài)技術(shù)上取得了重大突破,實現(xiàn)了從單一文本交互到“圖文音視頻”全模態(tài)融合的跨越。

這一進(jìn)展使得大模型能夠更全面、準(zhǔn)確地理解和處理信息,為用戶提供更加豐富、直觀的交互體驗。

Gartner預(yù)計,到2027年,40%的生成式AI解決方案將采用多模態(tài)技術(shù),較2023年的1%顯著提升。

在國內(nèi),火山引擎于今年6月發(fā)布豆包大模型1.6、視頻生成模型Seedance1.0pro等新模型,其中豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,讓用戶能夠通過圖像、語音等多種方式與模型進(jìn)行交互,極大地拓展了應(yīng)用場景。

商湯日日新大模型從1月推出原生融合模態(tài)版本,到4月升級V6實現(xiàn)多模態(tài)推理突破,不斷迭代技術(shù),提升模型的多模態(tài)處理能力。

快手可靈AI構(gòu)建多模態(tài)創(chuàng)意生產(chǎn)力平臺,上線一年多以來,已累計生成1.68億個視頻和3.44億張圖片,為內(nèi)容創(chuàng)作領(lǐng)域帶來了新的活力。

 

圖片

離線大模型,獨立運行與記憶革新 

在大模型技術(shù)蓬勃發(fā)展的當(dāng)下,離線大模型憑借獨特優(yōu)勢成為行業(yè)新焦點。

其最大特點是能在無網(wǎng)絡(luò)連接的情況下獨立運行,這有效規(guī)避了網(wǎng)絡(luò)不穩(wěn)定或斷網(wǎng)導(dǎo)致的服務(wù)中斷問題。

在野外探險、偏遠(yuǎn)地區(qū)作業(yè)以及網(wǎng)絡(luò)信號差的場所,離線大模型設(shè)備能穩(wěn)定提供智能服務(wù)

從技術(shù)層面來看,離線大模型實現(xiàn)了模型的本地化部署,數(shù)據(jù)處理和計算都在本地設(shè)備完成,極大提升了隱私安全性。

像醫(yī)療、金融等對數(shù)據(jù)保密性要求極高的行業(yè),使用離線大模型可確保敏感數(shù)據(jù)不出本地,降低數(shù)據(jù)泄露風(fēng)險。

 

圖片

 

今年WAIC上,諸多企業(yè)展示新成果 

RockAI推出的最新版非Transformer架構(gòu)大模型Yan 2.0 Preview,在離線和記憶功能方面表現(xiàn)亮眼。

它打破傳統(tǒng),將離線大模型部署邊界下探到“千元機(jī)”級別,讓低配置設(shè)備也能實現(xiàn)離線實時AI運算。

新增的“記憶模塊”是一大突破,如同人類大腦海馬體,能存儲學(xué)習(xí)過程中的關(guān)鍵信息并在新場景快速調(diào)用。 

現(xiàn)場演示中,搭載該模型的機(jī)器狗,無需預(yù)設(shè)程序,通過記憶模塊學(xué)習(xí)工作人員展示的自定義新動作后成功執(zhí)行,這種持續(xù)進(jìn)化和自主決策能力,是傳統(tǒng)大模型難以企及的。

 

圖片

 

Google DeepMind推出的Gemini Robotics On-Device模型也備受矚目,作為專為雙臂機(jī)器人設(shè)計的VLA基礎(chǔ)模型,它能直接解析自然語言指令并驅(qū)動機(jī)器人執(zhí)行相應(yīng)動作。

核心優(yōu)勢在于能在機(jī)器人本地離線運行,同時處理視覺識別、語言理解與動作執(zhí)行任務(wù),在醫(yī)療操作、災(zāi)難救援、工廠自動化等對實時性和穩(wěn)定性要求高的場景中,有效避免了云端傳輸?shù)难舆t和潛在風(fēng)險。

另外,谷歌開源的AI Edge Gallery,允許用戶在手機(jī)上本地運行大模型,完全離線且免費,支持從Hugging Face下載各種大模型,實現(xiàn)不聯(lián)網(wǎng)狀態(tài)下的聊天、識圖、代碼生成和文本推理等功能,滿足了用戶在隱私保護(hù)、本地算力利用以及弱網(wǎng)環(huán)境下使用AI的需求 。

英特爾展示的基于本地的大語言模型采用三合一模型,可離線運行。中文語料庫搭載62億參數(shù)的GIM2 - 6B模型,擁有32K的上下文支持能力,通過超1.4萬億的英文和中文令牌進(jìn)行預(yù)訓(xùn)練,模型性能和推理能力較強(qiáng)。

還本地化部署了專門處理編程語言的starcolder - 15.5B模型,方便程序員在離線環(huán)境下進(jìn)行代碼生成和理解 。

這些企業(yè)的成果展示,不僅體現(xiàn)了離線大模型在技術(shù)上的創(chuàng)新突破,也預(yù)示著其在未來智能設(shè)備、工業(yè)生產(chǎn)、個人隱私保護(hù)等多領(lǐng)域的廣闊應(yīng)用前景

 

圖片

結(jié)尾:智能的“最后一公里”,我們準(zhǔn)備好了嗎? 

當(dāng)一個擁有自主行動能力的智能體,可以在我們的物理世界中離線活動時,它所帶來的想象空間是巨大的。從能夠照顧老人的家庭伴侶,到可以進(jìn)行精細(xì)操作的外科手術(shù)助手,再到能夠深入險境的救援隊員,機(jī)器人的應(yīng)用邊界被前所未有地拓寬了。

然而,這也帶來了新的思考。當(dāng)機(jī)器的決策過程完全在本地完成,變得不再那么透明和可控時,我們?nèi)绾未_保其行為的安全性與可靠性?當(dāng)一個機(jī)器人能夠在沒有外部監(jiān)督的情況下自主學(xué)習(xí)和行動,我們又該如何界定責(zé)任的邊界?

Google DeepMind實驗室的這一步,無疑是邁向通用人工智能的重要一步,它叩響了物理世界智能化的大門。但這扇門背后,既有前所未見的機(jī)遇,也有需要我們審慎面對的挑戰(zhàn)。這不僅僅是工程師和科學(xué)家的議題,更是我們每一個人都需要開始思考的未來。

內(nèi)容來源于:

36氪:離線+記憶,大模型進(jìn)化的分水嶺

尕燚龍科技茶館:Google機(jī)器人離線模型,從“云端智者”走向“地面實干家”

醫(yī)械筆記本:斷網(wǎng)沒關(guān)系,谷歌發(fā)布具身智能離線模型,可本地化部署

       原文標(biāo)題 : AI芯天下丨趨勢丨離線+記憶,離線大模型將成下一代通用人工智能的基石

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號