相機(jī)的時(shí)代:Google Lens一年蛻變錄
人工智能時(shí)代,沒有人會(huì)覺得相機(jī)的功能只是單純的拍照。
隨著智能手機(jī)的普及,存儲(chǔ)變得更加便宜和便利,我們可以隨時(shí)拍攝各種類型的照片,從日出到日落,從他拍到自拍。旅行、學(xué)習(xí)、工作,相機(jī)滲透到我們生活的方方面面。
據(jù)估計(jì),我們的大腦皮層中有30%的神經(jīng)元是用于視覺的。每一個(gè)清醒的時(shí)刻,我們都依靠我們的視覺來感知我們周圍的環(huán)境,記住各種各樣的信息,并探索我們周圍的世界。
我們使用相機(jī)的方式并不是唯一改變的事情,相機(jī)背后的技術(shù)也在不斷發(fā)展。
隨著硬件、軟件和人工智能的不斷發(fā)展,相機(jī)將遠(yuǎn)遠(yuǎn)超越攝影,它將幫助我們搜索所看到的事物,提供更多的信息。
Google Lens就是在這樣的背景下誕生的。
Google Lens是谷歌在2017年推出的一項(xiàng)技術(shù),簡(jiǎn)單來說就是利用手機(jī)上的攝像頭,能夠掃描產(chǎn)品、動(dòng)物、文本或者其它存在于環(huán)境當(dāng)中的事物,并成功將其識(shí)別出來。
這項(xiàng)服務(wù)依賴于由谷歌及其它來源提供的信息,借此為用戶提供與目標(biāo)相關(guān)的準(zhǔn)確資料。
谷歌在一篇新的博客文章中寫道,Google Lens現(xiàn)在可以識(shí)別超過10億件物品。
當(dāng)然,這10億件商品來自Google購(gòu)物中提供的產(chǎn)品,因此,那些模糊不清的東西就不會(huì)包含在內(nèi)了,例如我們小時(shí)候玩的游戲機(jī)或某個(gè)稀有書籍的第一版。
除了購(gòu)物項(xiàng)目之外,谷歌鏡頭現(xiàn)在還可以識(shí)別人員、Wi-Fi網(wǎng)絡(luò)名稱和幾何形狀。
這也算谷歌鏡頭一項(xiàng)重大的進(jìn)步了。
一、Google Lens:搜索你看到了什么
當(dāng)我們看到一只可愛的秋田犬,想知道它的品種是什么?我們會(huì)怎么向別人形容它呢?黃色的、毛茸茸、愛笑,這應(yīng)該算是很多品種的狗狗共有特征。
但是,如果你用谷歌鏡頭對(duì)準(zhǔn)狗狗,那么,關(guān)于狗狗的品種和其它信息就會(huì)立馬呈現(xiàn)在你的手機(jī)上。
也就是說,Google Lens把你看到的內(nèi)容轉(zhuǎn)換為搜索查詢。
除了搜索你看到的物體,Google Lens還可以找到你的興趣點(diǎn),比如,當(dāng)我們把鏡頭對(duì)準(zhǔn)一個(gè)建筑物,就會(huì)自動(dòng)顯示相關(guān)的信息和網(wǎng)上評(píng)論,或者,我們把鏡頭對(duì)準(zhǔn)一個(gè)音樂專輯,谷歌鏡頭會(huì)自動(dòng)識(shí)別其標(biāo)題并為你提供源自網(wǎng)絡(luò)的評(píng)論內(nèi)容。
當(dāng)然,谷歌識(shí)別也不是每次都是正確的,一些特性不是那么明顯的物體,它就很有可能識(shí)別錯(cuò)誤。
Google Lens是在去年谷歌I/O開發(fā)者大會(huì)推出的,主要運(yùn)用機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺技術(shù),當(dāng)時(shí),Google Lens還僅面向谷歌公司的Pixel系列手機(jī)產(chǎn)品,且首先登陸Pixel 2設(shè)備之上(隨后也可在初代Pixels上運(yùn)行)。
現(xiàn)在,Google Lens可以在其他安卓手機(jī)上運(yùn)行,也可在蘋果IOS系統(tǒng)運(yùn)行。
二、Google Lens:讀懂現(xiàn)實(shí)世界
在今年的I/O開發(fā)者大會(huì)上,谷歌針對(duì)Google Lens進(jìn)行了三項(xiàng)更新。
1、智能文本選擇功能
這個(gè)功能可以將我們看到的單詞與需要的答案和操作連接起來。Google Lens可以閱讀現(xiàn)實(shí)世界的文本信息,并且可以復(fù)制并粘貼這些文本到手機(jī)上,比如食譜或Wi-Fi密碼。
為了教導(dǎo)鏡頭閱讀,谷歌開發(fā)了一個(gè)光學(xué)字符識(shí)別(OCR)引擎,并將其與我們對(duì)搜索語言和知識(shí)圖的理解相結(jié)合。谷歌使用不同的字符、語言和字體訓(xùn)練機(jī)器學(xué)習(xí)算法,并使用Google Books掃描等資源。
有時(shí)候,Google Lens很難區(qū)分字母“o”和“0”之類的相似字符。對(duì)此,Google Lens使用谷歌搜索中的語言和拼寫校正模型來更好地理解角色或單詞的可能性。比如,看到“c00kie”,Google Lens可以猜測(cè)單詞的意思是“餅干”。
2、風(fēng)格搜索
當(dāng)一件衣服或家居裝飾吸引了我們的眼球,我們可以打開鏡頭,不僅可以得到關(guān)于那件特定物品的信息,而且還可以看到與你喜歡的款式相似的東西。
3、實(shí)時(shí)搜索
Google Lens現(xiàn)在能夠主動(dòng)地即時(shí)呈現(xiàn)信息,它將其鎖定在您用戶看到的事物上。用戶只需對(duì)準(zhǔn)相機(jī),Google Lens可以在瞬間識(shí)別出數(shù)十億個(gè)單詞、短語、位置和事物,用戶就可以更好地瀏覽周圍的世界。
結(jié)語:
當(dāng)我們走在國(guó)外陌生的街道上,只需把手機(jī)鏡頭對(duì)準(zhǔn)不認(rèn)識(shí)的字,相機(jī)就可以自動(dòng)翻譯;當(dāng)我們站在某個(gè)建筑物面前,打開相機(jī),就可以了解關(guān)于這個(gè)建筑物的一切信息。
我們現(xiàn)在正處在一個(gè)相機(jī)的時(shí)代,人工智能和機(jī)器學(xué)習(xí)的快速發(fā)展,可以使相機(jī)成為我們周圍世界的強(qiáng)大而直觀的界面。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 7 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市