一文詳解計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)的應(yīng)用
全球汽車(chē)快訊 據(jù)外媒報(bào)道,當(dāng)人們看風(fēng)景或看圖像時(shí),他(她)們能夠理解看到的內(nèi)容——風(fēng)景或照片內(nèi)的目標(biāo)。
若該行為正在進(jìn)行中,那么會(huì)發(fā)生什么呢?而一臺(tái)計(jì)算機(jī)則僅能處理用于描述各像素顏色值的數(shù)字?jǐn)?shù)據(jù)。
對(duì)于某個(gè)人而言,從凌亂的桌面上識(shí)別出一塊披薩,可謂毫不費(fèi)力。但直到如今,計(jì)算機(jī)卻無(wú)法執(zhí)行這類(lèi)任務(wù)。
計(jì)算機(jī)視覺(jué)(簡(jiǎn)稱(chēng):CV)可幫助一臺(tái)計(jì)算機(jī)從視覺(jué)輸入中選出重要的信息,然后基于該信息進(jìn)行精準(zhǔn)的預(yù)測(cè)并提出建議。
計(jì)算機(jī)視覺(jué)的工作原理是?
在計(jì)算機(jī)視覺(jué)誕生之前,為創(chuàng)建一個(gè)程序來(lái)識(shí)別特殊的圖像,某人需要耗費(fèi)數(shù)小時(shí)的時(shí)間,來(lái)手動(dòng)完成這類(lèi)繁瑣的工作。
首先,需要核對(duì)一個(gè)相似圖像的數(shù)據(jù)庫(kù)。然后,不得不人工分析、測(cè)量這類(lèi)圖像,當(dāng)研究人員或許能識(shí)別存疑的目標(biāo)時(shí),標(biāo)注相關(guān)的數(shù)據(jù)(如:顏色、測(cè)量值及形狀)。當(dāng)時(shí),或許只有軟件能被用于預(yù)測(cè)工作。
而計(jì)算機(jī)視覺(jué)則采用深度學(xué)習(xí)這類(lèi)機(jī)器學(xué)習(xí)方法,自動(dòng)完成上述的所有流程。
深度學(xué)習(xí)采用了多層神經(jīng)元網(wǎng)絡(luò),其含有數(shù)百個(gè)潛在的層級(jí)。若遇到圖像,則通常采用一個(gè)卷積神經(jīng)元網(wǎng)絡(luò)(convolutional neural network,CNN)。
詳細(xì)解釋深度學(xué)習(xí)和神經(jīng)元網(wǎng)絡(luò)的工作原理已遠(yuǎn)超本文的內(nèi)容范疇。從本質(zhì)上講,就是向神經(jīng)元網(wǎng)絡(luò)送入大量的數(shù)據(jù)。然后,神經(jīng)元網(wǎng)絡(luò)會(huì)反復(fù)分析數(shù)據(jù),直到能做出精準(zhǔn)的預(yù)測(cè)為止。
以用于某個(gè)計(jì)算機(jī)視覺(jué)的卷積神經(jīng)元網(wǎng)絡(luò)為例,神經(jīng)元網(wǎng)絡(luò)將通過(guò)多個(gè)步驟來(lái)取得數(shù)據(jù)。首先,神經(jīng)元網(wǎng)絡(luò)將圖像拆解為多個(gè)部分(單個(gè)像素或預(yù)先標(biāo)注過(guò)的像素組)。
然后,對(duì)不同部分的圖像(如:硬邊緣或特定目標(biāo))進(jìn)行預(yù)測(cè)。神經(jīng)元網(wǎng)絡(luò)還會(huì)反復(fù)檢查其預(yù)測(cè)結(jié)果的準(zhǔn)確性,每次都會(huì)對(duì)算法進(jìn)行微調(diào),直至其變得極為精準(zhǔn)。
如今,計(jì)算機(jī)的功能變得極為強(qiáng)大,相較于人腦,前者對(duì)圖像的分析速度更快。當(dāng)其學(xué)會(huì)識(shí)別特定模式后,情況就更是如此了。為此,深度學(xué)習(xí)算法或?qū)⑦h(yuǎn)超人類(lèi)的能力,這一點(diǎn)不難看出。
計(jì)算機(jī)視覺(jué)的類(lèi)型有哪些呢?
計(jì)算機(jī)視覺(jué)涉及對(duì)圖像的分析與理解、對(duì)圖像相關(guān)預(yù)測(cè)或決策的輸出。為實(shí)現(xiàn)這類(lèi)目標(biāo),計(jì)算機(jī)視覺(jué)有各類(lèi)不同的任務(wù),如下:
圖像分類(lèi):識(shí)別圖像的類(lèi)型。例如,分辨是人臉、景色還是目標(biāo)。這類(lèi)任務(wù)常被用于迅速識(shí)別圖像并予以分類(lèi)。該技術(shù)的一項(xiàng)用途是自動(dòng)識(shí)別并屏蔽社交媒體上的“不健康”內(nèi)容。
目標(biāo)識(shí)別:類(lèi)似于圖像分類(lèi),目標(biāo)識(shí)別可識(shí)別某個(gè)場(chǎng)景內(nèi)的特定目標(biāo)——如:從凌亂的桌面上識(shí)別出一塊披薩。
邊緣檢測(cè):計(jì)算機(jī)視覺(jué)技術(shù)的常見(jiàn)用法,通常是目標(biāo)檢測(cè)的第一步,該技術(shù)可識(shí)別圖像內(nèi)的硬邊緣。
目標(biāo)標(biāo)識(shí):這指的是對(duì)某個(gè)目標(biāo)物或圖像中的個(gè)別例子進(jìn)行識(shí)別,例如:標(biāo)注某個(gè)特定的人、指紋或車(chē)輛。
目標(biāo)檢測(cè):目標(biāo)檢測(cè)指的是識(shí)別某張圖片內(nèi)的特定特征進(jìn)行標(biāo)識(shí),例如:X光片中的骨折。
目標(biāo)分割:指的是識(shí)別圖像中的哪個(gè)像素屬于存疑的目標(biāo)。
目標(biāo)追蹤:在一段視頻序列中,在識(shí)別某個(gè)目標(biāo)后,可輕松在整段視頻中追溯到該目標(biāo)。
圖像復(fù)原:在精準(zhǔn)標(biāo)識(shí)圖像中的目標(biāo)物與背景后,可移除圖像中的模糊、噪點(diǎn)及其他圖像偽影。
計(jì)算機(jī)視覺(jué)的應(yīng)用示例
人工智能技術(shù)已被用于多個(gè)行業(yè),并產(chǎn)生了驚人的影響。計(jì)算機(jī)視覺(jué)技術(shù)也同樣如此。以下是計(jì)算機(jī)視覺(jué)在當(dāng)下的幾個(gè)應(yīng)用示例。
面部識(shí)別
面部識(shí)別是當(dāng)今計(jì)算機(jī)視覺(jué)的主要應(yīng)用方式之一。當(dāng)對(duì)已知面部圖像數(shù)據(jù)庫(kù)進(jìn)行照片比對(duì)時(shí),計(jì)算機(jī)視覺(jué)算法可精準(zhǔn)地識(shí)別個(gè)人。
社交媒體分析圖像并自動(dòng)為經(jīng)過(guò)一輪圖像篩選后的用戶(hù)貼標(biāo)
筆記本電腦、電話和安全設(shè)備可對(duì)人們的身份加以識(shí)別,并給予合規(guī)人員使用權(quán)限。
執(zhí)法人員在閉路電池系統(tǒng)內(nèi)使用面部識(shí)別來(lái)確定嫌疑人的身份。
醫(yī)藥
目前,計(jì)算機(jī)視覺(jué)被用于醫(yī)療保健行業(yè),旨在為患者提供更快捷、更精準(zhǔn)的診斷,其診斷結(jié)果甚至遠(yuǎn)勝于醫(yī)學(xué)專(zhuān)家。
該技術(shù)的諸多應(yīng)用還涉及:對(duì)X光、計(jì)算機(jī)斷層掃描或核磁共振影像進(jìn)行分析并用于篩查神經(jīng)系統(tǒng)病癥、腫瘤、骨裂或骨折等特定疾病。
自動(dòng)駕駛汽車(chē)
自動(dòng)駕駛汽車(chē)需要對(duì)車(chē)輛周邊環(huán)境進(jìn)行了解,以便確保駕駛安全性。這意味著需要識(shí)別道路、車(chē)道、交通信號(hào)燈、其他車(chē)輛、行人等。
上述所有任務(wù)均能利用計(jì)算機(jī)視覺(jué)系統(tǒng)進(jìn)行實(shí)時(shí)探查,從而規(guī)避碰撞事故并確保駕駛安全性。
計(jì)算機(jī)視覺(jué)充滿(mǎn)挑戰(zhàn)性
當(dāng)前計(jì)算機(jī)視覺(jué)的應(yīng)用已開(kāi)始向我們涉及的各行各業(yè)滲透。從能夠探查故障設(shè)備或破損設(shè)備到精準(zhǔn)地診斷出癌癥,計(jì)算機(jī)視覺(jué)有能力提升各系統(tǒng)的能力并挽救生命。
但是,該技術(shù)也絕非沒(méi)有挑戰(zhàn)。計(jì)算機(jī)視覺(jué)仍遠(yuǎn)不及人眼視覺(jué)。我們?nèi)祟?lèi)進(jìn)化了數(shù)千年,從而使我們能夠識(shí)別并了解幾乎實(shí)時(shí)發(fā)生在我們身邊的所有事情。然而,我們?nèi)圆磺宄四X是如何執(zhí)行這類(lèi)任務(wù)的。
深度學(xué)習(xí)是在正確道路/方向上邁出的一大步,但仍需要海量的工作量來(lái)創(chuàng)建一個(gè)系統(tǒng),以確保該系統(tǒng)能執(zhí)行人類(lèi)輕松搞定的任務(wù),例如:識(shí)別道路上的某輛汽車(chē)。然而,研發(fā)一臺(tái)可理解視覺(jué)世界所有復(fù)雜性的計(jì)算機(jī)卻完全是另外一碼事了。
在人工智能應(yīng)用和人類(lèi)生物學(xué)方面還需要進(jìn)行更多的研究,我們希望能在不久的將來(lái)看到計(jì)算機(jī)視覺(jué)技術(shù)的可應(yīng)用領(lǐng)域呈現(xiàn)爆發(fā)式增長(zhǎng)。(本文為編譯作品,所用英文原文和圖片選自makeuseof)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋(píng)果把身家押在Siri上:一場(chǎng)輸不起的自我革命
- 10 騰訊米哈游押寶的中國(guó)AI應(yīng)用,正在海外悶聲發(fā)財(cái)