計算機(jī)視覺簡史:被稱為“人臉識別”的計算機(jī)視覺經(jīng)歷了什么?
艱難的商業(yè)化:合適的落地場景難找
其實,在2015年那一次機(jī)器識別準(zhǔn)確率高于人眼之前,如今的AI四小龍已經(jīng)成立了。
其中曠視科技成立最早——2011年,云從科技成立最晚——2015年。
曠視科技由三個年輕人正式創(chuàng)立,三位創(chuàng)始人是清華“姚班”畢業(yè)的印奇、唐文斌、楊沐。
商湯科技則是由香港中文大學(xué)信息工程系湯曉鷗組建的,是產(chǎn)學(xué)研的極佳代表。
云從科技周曦的核心創(chuàng)始團(tuán)隊有中科院背景,融資又是全內(nèi)資與政府基金背景,云從又被外界稱為“AI國家隊”,在“AI四小龍”中,云從國資背景最強(qiáng)。
依圖科技由朱瓏、林晨曦共同創(chuàng)立,林晨曦曾經(jīng)是阿里的第一任技術(shù)總監(jiān),更早之前是在微軟亞洲研究院,是產(chǎn)業(yè)背景最深的一個。
這四家都在2015年拐點之前成立并一起迎接了牛市的到來。
當(dāng)人臉識別的算法首次獲得突破人眼的成就之時,創(chuàng)業(yè)者和資本都很興奮。
整個計算機(jī)視覺行業(yè)和人臉識別產(chǎn)業(yè)也迎來了第一波投資上的熱潮,但隨后的商業(yè)化過程卻并不容易。
因為,當(dāng)為這項技術(shù)找一個落地姿勢的時候,就非常明顯地遇到了兩個大問題:
第一個困境是,人臉識別就算再牛,也只是一個模塊技術(shù)。這個屬性意味著,它無法作為一個獨立的業(yè)務(wù)出現(xiàn),而大多是為原先的業(yè)務(wù)做增強(qiáng)服務(wù)。比如在金融業(yè)務(wù)中做人臉校驗加強(qiáng)密碼屬性,比如使用人臉檢索功能加強(qiáng)安防等領(lǐng)域的防控效率,比如相似人臉推薦可以用來做婚介社交和整容設(shè)計。
這樣的屬性意味著,如果沒有合適的落地賽道,人臉識別就是空中樓閣。即便找到了合適的落地賽道,人臉識別在其中的價值量占比也不夠高。
第二個困境其實是第一個困境帶來的,由于需要具體的落地場景、價值占比不夠高,這項技術(shù)始終沒有找到比較好的商業(yè)模式。
行業(yè)中常見的有幾種模式,要么是直接賣產(chǎn)品、要么賣人臉SDK授權(quán)和API服務(wù),要么使用后臺流量變現(xiàn)。算法再好,也需要產(chǎn)品。沒有真正的標(biāo)準(zhǔn)化產(chǎn)品,它就會淪為項目制中的一個模塊,很難做大規(guī)模;甚至有些將它作為免費的額外服務(wù)提供。
比如在A股曾經(jīng)火爆過一陣的人臉識別閘機(jī)相關(guān)概念股,最后大家發(fā)現(xiàn)其實只要達(dá)到一定精度(不需要最高),誰都可以做,技術(shù)門檻并不高。
也就是說,AI的最終任務(wù)是實現(xiàn)在各垂直行業(yè)的場景化落地,并找到在其中AI能發(fā)揮最大價值、實現(xiàn)良好商業(yè)模式的場景賽道;蛘,打造一個通用型平臺。
中國AI行業(yè)融資規(guī)模與投融資數(shù)量在2013-2018年整體快速增長,但2019年出現(xiàn)45%左右的顯著下滑,2020年投融資金額恢復(fù)42.5%正增長,但距2018年顛覆時期仍有差距,投融資數(shù)量顯著下降。
二級市場的熱度也可以通過研報數(shù)量提供輔證,以”人臉識別“作為關(guān)鍵詞為例,在Wind上2015年這一關(guān)鍵詞搜索到的行業(yè)研究(不含個股研究)報告(僅以Wind數(shù)據(jù)為例,不保證完全覆蓋)數(shù)量為17篇。而在2014年這一數(shù)據(jù)為0,2018年-2020年,每年都只有1篇。
在人工智能發(fā)展的最初,算法研發(fā)能力的評判是對一家創(chuàng)業(yè)企業(yè)最有效的估值方法,換句話說,也就是從企業(yè)的投資轉(zhuǎn)為對技術(shù)甚至是對人才的投資。
2014年年初,谷歌創(chuàng)始人拉里佩奇親自操刀了一宗收購案,斥資5.4億美元,收購一家名為DeepMind的人工智能公司,也就是后來研發(fā)AlphaGo的公司。而那時,DeepMind是沒有任何商業(yè)模式方面的探索的,谷歌僅僅是為了人才,就可以掏出5.4億美元。
但當(dāng)AI競爭進(jìn)入深水區(qū),商業(yè)化才是真正的考驗。
上市肉搏戰(zhàn):商業(yè)模式破冰乏力
在這種困境中,AI四小龍也基本都開始轉(zhuǎn)型了,尋找不同的落地場景。
計算機(jī)視覺產(chǎn)業(yè)鏈可劃分為基礎(chǔ)層、技術(shù)層和應(yīng)用層;A(chǔ)層包括硬件支持、算法支持和數(shù)據(jù)集;技術(shù)層包括視覺技術(shù)平臺、視頻識別、圖片識別和模式匹配;應(yīng)用層包括計算機(jī)視覺技術(shù)在智慧城市、智慧安防、智慧物流、智慧金融、手機(jī)終端和智慧商業(yè)等領(lǐng)域的應(yīng)用。
曠視科技,在原創(chuàng)技術(shù)的研究基礎(chǔ)上加上IOT、公共IOT、商業(yè)IOT等三個領(lǐng)域的頂層設(shè)計,開始逐步打開局面,主要專注于物聯(lián)網(wǎng)領(lǐng)域。
商湯科技呢,則開始向平臺型“操作系統(tǒng)”轉(zhuǎn)型,試圖擺脫單一賽道帶來的困境。與其他企業(yè)專注特定賽道相比,商湯沒有選擇具體的細(xì)分賽道。從現(xiàn)在的情況看,它更多是將自己定義為了一個“AI零部件”生產(chǎn)工廠。
云從科技從創(chuàng)立一開始,就是唯一一個有”國家隊“背景的公司,它背后站著中科院,目前公司主力業(yè)務(wù)針對金融,是銀行領(lǐng)域第一大AI供應(yīng)商,以為客戶提供解決方案為主。
依圖則是一開始將計算機(jī)視覺業(yè)務(wù)對接安防的,提供算法產(chǎn)品的輸出。隨著后續(xù)項目落地,開始轉(zhuǎn)向醫(yī)學(xué)圖像和智能城市業(yè)務(wù)。目前,依圖的業(yè)務(wù)重點已經(jīng)是自研AI芯片了,逐步從純軟件轉(zhuǎn)向底層硬件+平臺結(jié)合的路線。
從競爭格局來看,以收入規(guī)模計,商湯科技排第一,曠視科技排在第二位,高于依圖科技與云從科技。不過依圖科技自從撤回招股書之后未再出現(xiàn)更新。
來源:招股書、華爾街見聞?wù)?/p>
至于盈利能力,借用此前某位AI行業(yè)的一級市場投資人的話說:
全球大部分AI公司的毛利率都很低,毛利率一般都在50%-60%,而軟件服務(wù)行業(yè)的毛利率在60%-80%以上。
這樣的結(jié)果正是目前AI行業(yè)普遍面臨的商業(yè)模式導(dǎo)致的,大部分公司都還在做定制化業(yè)務(wù),不管是做政府業(yè)務(wù)、還是金融業(yè)務(wù),只要面對大型客戶,這些AI企業(yè)都很難使用通用打包產(chǎn)品提供客戶所需要的服務(wù)。
最后就會變得和傳統(tǒng)IT企業(yè)一樣,要通過堆人頭、做項目來獲得收入。
2G的業(yè)務(wù)越多,毛利率就越低、銷售費用率就越高。以2020年數(shù)據(jù)計算,依圖科技(只有上半年數(shù)據(jù))和商湯科技毛利率均超過70%,但云從和商湯毛利率都低于上述投資人說的50%下限。
更要命的是,由于AI類企業(yè)的研發(fā)投入要高于一般的IT企業(yè),因此最終每一家公司都處于虧損狀態(tài)。
虧得最多的商湯科技,3年多虧200多億。
在這種局面之下,上市尋求更多資金支持就成為一條不得不走的路。
計算機(jī)視覺的前路——工業(yè)、醫(yī)療
但計算機(jī)視覺之路卻并沒有被堵死,因為除了”人臉識別“之外,還有工業(yè)機(jī)器視覺和醫(yī)療影像識別。
1、工業(yè)機(jī)器視覺
據(jù)天風(fēng)證券的研究報告,機(jī)器視覺在工業(yè)應(yīng)用中,可以用來甄別物體特征、定位、測量并檢測,而這些通過人眼是很難完成的。
工業(yè)視覺具備極強(qiáng)的機(jī)器特性,如極高的速度、精度、重復(fù)性等,這些特性成為工業(yè)機(jī)器視覺 產(chǎn)品的重要參數(shù)。
與此同時,工業(yè)機(jī)器視覺擁有采集大量現(xiàn)場數(shù)據(jù)的能力,數(shù)據(jù)是驅(qū)動行業(yè)快速迭代、獲取信息 的重要來源,這也將成為工業(yè)機(jī)器視覺未來的巨大可能。
傳統(tǒng)的工業(yè)機(jī)器視覺采用本地數(shù)據(jù)存儲和處理, 通過本地總線連接,每臺設(shè)備搭載一臺性能強(qiáng)大的電腦進(jìn)行數(shù)據(jù)的存儲和處理;而現(xiàn)在的機(jī)器視覺系統(tǒng)通過有線(光纖/銅纜) 或無線(WiFi/4G/5G)連接至PC端,PC端無需放置在本地。
因此隨著5G的到來,機(jī)器視覺有望迎來更好的發(fā)展。
2、醫(yī)療影像
當(dāng)前中國CT行業(yè)影像數(shù)據(jù)爆 炸增長,2019年市場規(guī)模達(dá)到24.7億元,CAGR約30%。另一方面,目前我國放射科醫(yī)師僅有8萬多名,每年承擔(dān)的診 斷工作量卻達(dá)到了14.4億張影像,結(jié)合中國醫(yī)學(xué)影像數(shù)據(jù)每年30%的增速,與之相對應(yīng)的放射科醫(yī)師的年增長速率卻只有4%,兩者之間存在巨大缺口,AI+CT影像識別有望彌補(bǔ)這一缺口,發(fā)展?jié)摿薮蟆?/p>
AI+CT影像的主要產(chǎn)品形態(tài)包括:影像分析與診斷軟件、CT影像三維重建系統(tǒng)、靶 區(qū)自動勾畫及自適應(yīng)放療系統(tǒng)。通過智能CT影像識別,能夠完成病例篩查、智能分析診斷、輔助臨床診療決策等工 作。從應(yīng)用的場景來看,主要包括胸部、四肢關(guān)節(jié)等部位,乳腺、心肺、冠狀動脈、骨骼等器官組織,應(yīng)用領(lǐng)域廣闊。
人工讀片存在主觀性高、重復(fù)性低、定量及信息利用度不足、耗時及勞動強(qiáng)度和知識經(jīng)驗的傳承困難等問題;而人工智能讀片的優(yōu)勢體現(xiàn)在高效率低成本。隨著產(chǎn)品的成熟帶動識別率的提升,人工智能讀片的精準(zhǔn)度也將形成比較優(yōu)勢。
尾聲
發(fā)展60多年來,機(jī)器視覺作為AI技術(shù)的急先鋒,經(jīng)歷了幾輪起落,終于迎來技術(shù)上的爆發(fā)。但隨著技術(shù)進(jìn)入深水區(qū),尋找合適的商業(yè)模式真正成為了機(jī)器視覺這門技術(shù)的最大難點。
互聯(lián)網(wǎng)巨頭的AI技術(shù)可以在自身不斷得到驗證,字節(jié)的推薦算法可以通過用戶點擊數(shù)據(jù)驗證;美團(tuán)的算法可以優(yōu)化騎手路線通過送達(dá)時間變化來驗證等。
我們最近看到的四小龍扎堆IPO僅僅是行業(yè)規(guī)范化、商業(yè)化的開端,計算機(jī)視覺的前路還很長。
但是國家政策一直是鼓勵并支持AI產(chǎn)業(yè)的發(fā)展的,相信未來它們一定能找到更好的出路,帶領(lǐng)中國的計算機(jī)視覺乃至整個AI產(chǎn)業(yè)走在全球前列。
來源:中國傳動網(wǎng)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實用主義
- 7 騰訊 Q2 財報亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機(jī)會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 騰訊米哈游押寶的中國AI應(yīng)用,正在海外悶聲發(fā)財