照片秒變icon?日本研究員提出基于生成對抗網(wǎng)絡(luò)的Iconify模型來幫忙!
AI圖標化的新技能
為了驗證這兩種模型是否可以對圖像進行有效的圖標化,研究人員分別對人體圖像、通用目標和基于logo訓(xùn)練的圖標化模型進行了實驗。
針對人體的圖標化,研究人員僅僅利用了包含人體的圖像和對應(yīng)的圖標進行訓(xùn)練。通過分類限制訓(xùn)練樣本的多樣性可以看到GANs圖標化的能力。在訓(xùn)練過程中僅僅使用了包含部分人體的圖像,同時去除了多人的圖標,最終利用從72張icon增強的1440張圖標和1684張真實人體圖像進行了訓(xùn)練。下圖顯示訓(xùn)練的數(shù)據(jù)樣本
下面分別比較了CycleGAN和UNIT模型對于人體圖標化的結(jié)果,可以看到兩種模型都可以較好地圖標化人體圖像,實現(xiàn)了對于人體的有效抽象。其中CycleGAN生成額結(jié)果更好,對于頭部和身體的形狀更為簡化。但針對面部特征的圖標化不太好主要是由于訓(xùn)練圖標數(shù)據(jù)中缺乏有效的面部細節(jié)特征。
由于CycleGAN具有循環(huán)損失,所以研究人員還對圖標化后的結(jié)果進行了圖像化,下圖顯示了圖像到圖標再到圖像的生成結(jié)果,以及圖標到圖像再到圖標的結(jié)果,顯示了模型對于圖像和圖標抽象能力的理解。
隨后研究人員將圖標化的過程拓展到了COCO中包含的通用物體上。由于物體的形狀各異、顏色紋理各不相同,模型需要處理的映射更為復(fù)雜。為此研究人員利用了由粗到精的策略來訓(xùn)練CycleGAN,依次在32x32,64x64,128x128,最終在256x256上進行訓(xùn)練。
下圖顯示了最終訓(xùn)練后生成的結(jié)果,其中橘色框中顯示了未參與訓(xùn)練的測試圖像及其結(jié)果,很好地抽象并描述了圖像中的目標。
盡管圖像為圖標提供了較多的設(shè)計信息,但其結(jié)果與第一個任務(wù)中的圖標相比還不夠抽象,與標準圖標還有所差異。例如上圖中的鐘表圖像就抽象的不太好。由于沒有設(shè)計的通用準則和標準,針對常規(guī)物體的圖標化顯示出了較大的差異性。
為了進一步驗證這種方法,研究人員還利用了彩色的logo數(shù)據(jù)集LLD對圖標化任務(wù)進行了訓(xùn)練,使得CycleGAN生成彩色的圖標。與上一個任務(wù)相比,生成圖標的質(zhì)量在色彩的幫助下有了很大的提升,例如下圖中的狗子圖標化結(jié)果就比上圖中要好很多,雖然顏色可能與原始圖像有差異,但整體的配色與形狀和我們的審美協(xié)調(diào)。
不過上圖中藍色框內(nèi)也顯示了一些錯誤圖標化的例子,例如鐘表沒有太多變化,第二個過于抽象化,第三、四個生成了文字,第五個則沒有保留明顯了目標信息。這主要是由于目標的背景、噪聲以及LLD的logo數(shù)據(jù)帶來的文字信息造成了一定影響。
但不可否認這種圖標化的方法可以有效地對目標圖像進行抽象處理,為設(shè)計師提供了創(chuàng)意參考、也為沒有設(shè)計基礎(chǔ)的小伙伴們提供了快速生成高質(zhì)量圖標的好辦法吧~

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題