訂閱
糾錯
加入自媒體

一份端側(cè)AI的內(nèi)部紀要:投資人應(yīng)真正關(guān)心的3個被忽略的問題!

當谷歌在Pixel 10上演示“實時AI摳圖”功能,以及蘋果預(yù)告將在2025秋季發(fā)布會推出“重新定義的AI手機”時,從供應(yīng)鏈傳出的每一個風聲,到華爾街連夜上調(diào)的出貨量預(yù)測,一個近乎完美的劇本已經(jīng)寫好:

一個由端側(cè)AI驅(qū)動的、史詩級的消費電子“超級升級周期”,即將到來。

但當市場的喧囂散去,一個更冷靜、也更致命的問題浮現(xiàn)出來:

當一個機會變得如此確定無疑,如果所有人都在談?wù)摱藗?cè)AI、所有芯片財報都在重復“On-Device AI”、所有品牌都在預(yù)告“革命性體驗”,它會不會已經(jīng)變成了一個“共識陷阱”?

今天,硅兔君結(jié)合近期與其專家團隊的交流成果就來聊聊共識之外,那三個決定未來勝負的“非共識”。

共識告訴你: 硬件環(huán)節(jié)確定性最高,是肉眼可見的紅利。

這個邏輯非常清晰。高通的驍龍8 Gen 3集成了Hexagon NPU,AI性能提升98%;聯(lián)發(fā)科的天璣9300號稱擁有330億參數(shù)大模型處理能力;蘋果的A17 Pro神經(jīng)引擎速度翻倍。Apple launches the A17 Pro chip with a completely redesigned GPU |  TechCrunch

這場算力軍備競賽,直接體現(xiàn)在了產(chǎn)業(yè)鏈的財報上:瑞芯微、恒玄科技等公司的業(yè)績增長曲線,陡峭得讓人心動。

這塊蜜糖,真實而甜美。但這會是常態(tài)嗎?

你需要追問的第一個非共識是:這場“算力內(nèi)卷”的盡頭是什么?

我們都經(jīng)歷過PC時代的CPU主頻大戰(zhàn),和智能手機早期的核戰(zhàn)。歷史一再證明,當硬件性能超越了主流應(yīng)用的需求,就會出現(xiàn)“性能過剩”,硬件溢價隨之消失,行業(yè)進入殘酷的存量搏殺。

今天手機NPU算力從50 TOPS卷到100 TOPS,除了讓AI修圖更快零點幾秒,對絕大多數(shù)用戶的體驗改善,是否正在邊際遞減?一旦體驗改善的曲線被算力增長的曲線追上,高昂的硬件溢價還能維持多久?

第二個更致命的問題是:誰在定義“有效算力”?

讓我們回顧一下NVIDIA是如何封神的。它的護城河,從來都不是GPU那塊芯片本身,而是CUDA——那個讓開發(fā)者欲罷不能的軟件開發(fā)生態(tài)。CUDA用十余年的時間,統(tǒng)一了AI開發(fā)的“語言”,讓數(shù)百萬開發(fā)者為NVIDIA的硬件“鎖定”。

真正的護城河,不是參數(shù)表上那個冷冰冰的TOPS數(shù)字,而是能讓開發(fā)者低成本、高性能地將算法跑起來的、充滿活力的軟件生態(tài)。Nvidia Stock: How CUDA Helps The Chip Giant Dominate AI

最后,別忘了手機之外的廣闊戰(zhàn)場。在智能汽車領(lǐng)域,Ambarella、瑞薩電子這類廠商,正通過高度定制化的AI視覺芯片(ASIC)搶占市場,它們不追求通用算力,而是在特定場景(如ADAS)下把能效比做到極致。這種“專用化”的降維打擊,是否會對手機芯片廠商“一芯多用”的平臺化策略構(gòu)成威脅?

硬件的戰(zhàn)爭,上半場是參數(shù),下半場是生態(tài)。當你還在為那20%的溢價歡呼時,真正聰明的錢,已經(jīng)在思考那個未來的生態(tài)霸主會是誰。

共識告訴你: 模型輕量化技術(shù),是讓大模型在終端設(shè)備運行的關(guān)鍵。

沒錯。通過模型剪枝、量化、知識蒸餾等一系列“手術(shù)”,百億參數(shù)的模型可以被壓縮到原來的十分之一,同時保持可接受的性能。我們已經(jīng)看到了Google的Gemini Nano被塞進Pixel手機,Meta的Llama 3也推出了適合端側(cè)運行的小參數(shù)版本。Google FINALLY Announces Gemini Nano for the Pixel 8!

但這個過程,遠比聽上去要復雜。

第一個被忽略的現(xiàn)實是:目前的模型壓縮,很大程度上還是個“手工作坊”。

它高度依賴頂尖AI科學家和工程師的經(jīng)驗、直覺和反復試錯,俗稱“煉丹”。這個過程成本高昂、周期漫長,且結(jié)果難以保證。這極大地限制了端側(cè)AI應(yīng)用的創(chuàng)新速度和普及廣度。

真正的行業(yè)爆發(fā)點,在于“自動化模型壓縮”(AutoML for Compression)工具鏈的成熟。

想象一下,開發(fā)者不再需要是算法專家,只需將自己的大模型上傳到一個平臺,平臺就能自動嘗試數(shù)千種壓縮方案,并找到那個在特定硬件上(比如某款手機芯片)性能和精度的最佳平衡點。這才是“工業(yè)化”的革命。

一些嗅覺敏銳的初創(chuàng)公司,如Deci AI(被英偉達收購)、Neural Magic(被 RedHat收購),已經(jīng)在嘗試將這個過程產(chǎn)品化。這才是AI時代的未來,他們不生產(chǎn)模型,但他們讓所有模型都能更便宜、更高效地運行在你的設(shè)備上。

第二個深水區(qū),是開源與閉源的路線之爭。以llama.cpp為代表的開源社區(qū),用驚人的速度,讓各種開源大模型在Mac、PC甚至手機上跑了起來,極大推動了技術(shù)的普及。GitHub - ggml-org/llama.cpp: LLM inference in C/C++

但另一邊,蘋果和谷歌則在自己的操作系統(tǒng)里,內(nèi)置了高度優(yōu)化的、不對外的模型和推理引擎。

這像極了移動互聯(lián)網(wǎng)的開端。未來,是安卓當年對iOS的“開放戰(zhàn)勝封閉”重演,讓百花齊放的開源方案占領(lǐng)市場?還是巨頭憑借軟硬一體的極致體驗和隱私保護,牢牢守住高端生態(tài)位,賺取最高的利潤?這兩種路徑,指向了完全不同的產(chǎn)業(yè)鏈投資機會。

最后,是數(shù)據(jù)的“隱形戰(zhàn)爭”。 輕量化后的模型,性能或多或少會有損失。如何彌補?答案是“端側(cè)微調(diào)”(On-device Fine-tuning)。利用你在設(shè)備上的個人數(shù)據(jù),讓模型變得更懂你。

但這又引出了終極難題:如何在利用數(shù)據(jù)的同時,絕對保護用戶隱私?聯(lián)邦學習(Federated Learning)等技術(shù)雖然被寄予厚望,但成熟度依然面臨挑戰(zhàn)。誰能率先解決“自動化工具鏈”、“生態(tài)路線”和“隱私數(shù)據(jù)”這三個問題,誰就掌握了端側(cè)AI軟件的“命脈”。

共識告訴你: 手機、汽車、IoT是三大落地場景,前景無限。

這當然是對的。但“場景”這個詞,最容易滋生泡沫。

第一個需要警惕的陷阱,就是“為了AI而AI”的功能堆砌。

還記得之前的Humane AI Pin和Rabbit R1嗎?它們被譽為“后智能手機時代”的硬件,但上市后的市場反應(yīng)卻相當冷淡。Rabbit R1 Explained: What This Tiny AI Gadget Actually Does - CNET

為什么?因為它們沒有找到一個無可替代的“殺手級應(yīng)用”。用戶不會為炫酷的技術(shù)概念買單,只會為它實實在在解決的問題付費。

現(xiàn)在手機上的AI消除路人、AI生成壁紙,汽車里的語音助手,是很好,但它們是能讓你下定決心多花2000塊錢的理由嗎?恐怕還不夠。

第二個需要建立的認知框架是:“殺手級應(yīng)用”的三個演進層次。

層次1 - 增強(Co-pilot): 這是目前的主流。無論是幫你潤色郵件,還是實時翻譯,AI的角色是你的“副駕駛”,提升現(xiàn)有任務(wù)的效率。這個層次的應(yīng)用價值在于“更好”,而非“從無到有”。

層次2 - 代理(Agent): 這才是未來的趨勢。當你能對手機說,“幫我訂一張明晚去上海的機票,找一家徐家匯附近評分4.5以上的酒店,然后把行程發(fā)給我老婆”,而它能自主調(diào)用航旅App、地圖App、微信來完成這一切時,革命才真正發(fā)生。這是對現(xiàn)有App孤島生態(tài)的徹底顛覆,也是對操作系統(tǒng)入口的終極爭奪。

層次3 - 預(yù)判(Guardian): 這是AI與個人數(shù)據(jù)深度結(jié)合的終極形態(tài)。它不再是被動響應(yīng),而是主動服務(wù)。比如你的智能手表在你心臟出現(xiàn)異常搏動前幾小時發(fā)出預(yù)警,你的智能家居在你回家前就調(diào)節(jié)到你最舒服的狀態(tài)。這個層次的應(yīng)用,壁壘最高,用戶粘性也最強。

由此,引出了那個價值萬億的終極拷問:價值最終歸屬于誰?

如果一個AI Agent幫你完成了所有事,那么,是這個Agent的開發(fā)者(比如一家新的超級App公司)賺走了大部分利潤?還是提供底層能力和分發(fā)渠道的操作系統(tǒng)(蘋果/谷歌)來“收稅”?那些被它調(diào)用的傳統(tǒng)App,又將淪為“管道”還是能分一杯羹?

這將是科技史上規(guī)?涨暗囊粓“價值重分配”。投資端側(cè)AI,你本質(zhì)上是在對未來的人機交互形態(tài),以及這場價值分配的最終格局下注。

你看,從共識到非共識,我們只多問了三個問題。

但這三個問題,恰恰是區(qū)分平庸和卓越的試金石。

       原文標題 : 一份端側(cè)AI的內(nèi)部紀要:投資人應(yīng)真正關(guān)心的3個被忽略的問題!

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號