拍照眨眼怎么辦?Facebook的AI新研究讓你“眼界大開”
現(xiàn)代生活中,我們P圖的方式多種多樣,比如去除紅眼、鏡頭曝光,等等。但是,拍照眨眼仍然很難處理。不過,最近Facebook的一項AI新研究能夠讓照片中閉眼的你“眼界大開”。
這一技術(shù)被譽為智能“內(nèi)畫”(intelligent in-painting),用開眼代替閉眼只是其中的用例之一。簡單來說,就是程序會自動向空間填充那些它認為本該存在里面的東西。Adobe目前已經(jīng)在”上下文感知檢索“中充分利用了這項技術(shù),讓用戶能夠無縫替換掉那些不想要的功能。
當然,替換眼睛是這項技術(shù)面臨的挑戰(zhàn)之一。因為,眼睛具有復雜性和多變性的特點,所以系統(tǒng)很難改變或者是創(chuàng)建此類內(nèi)容。
不過,由于Facebook掌握巨大的圖片數(shù)據(jù)庫,擁有許多人眨眼的照片,所以決定要嘗試去破解這個難題。
想要實現(xiàn)這一點,就需要依靠生成式對抗性網(wǎng)絡(luò)(Generative Adversarial Network,以下簡稱GAN),其本質(zhì)上就是一個機器學習系統(tǒng)。這個系統(tǒng)要學會欺騙自己,讓自己覺得所造的事物是真實可靠的。在GAN中,系統(tǒng)的其中一部分要學習去識別內(nèi)容,而另一部分則負責去創(chuàng)造內(nèi)容。當然,內(nèi)容創(chuàng)造會根據(jù)內(nèi)容識別的反饋信息來進行。
在這一條件下,這個網(wǎng)絡(luò)既能夠識別眼周環(huán)境,同時也能創(chuàng)建一雙眼睛。正如上圖所示,目前這項技術(shù)已經(jīng)可以使用了,但是仍有一些不太理想的地方。系統(tǒng)似乎只是單一地復制粘貼人類的眼睛,但是并沒有考慮到圖像的一致性。
機器就是這么傻,他們沒有辦法理解的是,當人們睜開眼睛時,眼周的顏色并不會隨之改變。或者換句話說,機器對于眼睛、顏色等信息都沒有直觀理解。
在Facebook研究人員輸入的樣本數(shù)據(jù)中,實驗對象的眼睛都是睜開的。這樣一來,GAN就能了解到眼睛在人體的位置、特定的形狀,以及顏色,等等。
結(jié)果顯示,并沒有明顯的色差或者是縫合痕跡。這是因為,系統(tǒng)中負責識別的部分非常清楚,真實的人類不長那樣兒。
在測試中,人們經(jīng)常會沒辦法判斷,哪些照片是真的睜眼,哪些只是系統(tǒng)模擬的睜眼照片;誤判率高達一半以上。
當然,這個系統(tǒng)也并非十全十美。在某些情況下,其仍然會出現(xiàn)失誤。比如說,當一個人的眼睛被頭發(fā)遮蓋住,或者是顏色矯正出現(xiàn)偏差的時候,系統(tǒng)生成的照片中就會出現(xiàn)一些奇怪的陰影。當然,這些問題都是可以解決的。
可以想象,當Facebook未來某天在平臺上審閱用戶照片的時候,如果一旦發(fā)現(xiàn)某個用戶的照片閉眼了,那么它就會自動用這個系統(tǒng)把用戶眼睛打開…說實話,這是有點讓人毛骨悚然。但是,至少這個系統(tǒng)可能可以拯救你相冊里面的不少照片。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題