訂閱
糾錯
加入自媒體

NeurIPS`25 | 感嘆歲月神偷!南開&三星開源Cradle2Cane:完美破解“年齡-身份”兩難困境!

2025-11-21 15:51
AI生成未來
關注

作者:Tao Liu, Dafeng Zhang等

解讀:AI生成未來

亮點直擊

直擊痛點,提出“Age-ID Trade-off”: 深入分析了人臉老化任務中“年齡準確性”與“身份保持”之間的內(nèi)在矛盾。現(xiàn)有方法往往顧此失彼,而本文提出的框架旨在打破這一零和博弈 。

首創(chuàng)兩階段(Two-Pass)解耦架構: 提出 Cradle2Cane 框架。第一階段利用自適應噪聲注入(AdaNI)專注于“變老”,第二階段利用身份感知Embedding(IDEmb)專注于“找回身份”。這種分而治之的策略實現(xiàn)了1+1>2的效果 。

巧妙的特征解耦設計: 引入了 SVR-ArcFace 和 Rotate-CLIP 模塊。通過奇異值重加權(SVR)剔除ArcFace特征中的年齡干擾,利用球面線性插值(Slerp)在CLIP空間平滑遷移年齡屬性,實現(xiàn)了身份與年齡特征的精準剝離與控制 。

基于SDXL-Turbo的高效推理:利用少步(Few-step)擴散模型的優(yōu)勢,僅需0.56秒即可生成高質(zhì)量圖像,在保持極高保真度的同時,完美支持從“幼年到老年(Cradle to Cane)”的全年齡段平滑變換 。

解決的問題

長期以來,人臉老化(Face Aging)任務都面臨一個核心挑戰(zhàn):如何在大幅度改變年齡特征的同時,完美保留原本的身份信息? 作者將這一挑戰(zhàn)定義為 “Age-ID Trade-off”(年齡-身份權衡)。

傳統(tǒng)GAN方法(如Lifespan, CUSP):在身份保持上表現(xiàn)尚可,但在處理大跨度年齡變化(如從幼年到老年)時,往往生成模糊,且難以模擬真實的皮膚紋理和骨骼變化 。

現(xiàn)有Diffusion方法(如FADING):雖然生成畫質(zhì)高,但往往伴隨著嚴重的身份漂移(Identity Drift),生成的“老年版”看起來像是另一個人 。 如圖1所示,現(xiàn)有方法的性能曲線往往呈現(xiàn)“trade-off”的趨勢——年齡遷移準確性越高,身份相似度就越低。反之,身份相似度越高,年齡遷移準確性就越低。如何打破這一現(xiàn)狀,實現(xiàn)全生命周期的高保真老化,是本文解決的核心問題。

提出的方案

本文提出了一種基于 SDXL-Turbo 的兩階段(Two-Pass)擴散框架 —— Cradle2Cane。該方案的核心思想是“解耦”:將年齡變換和身份保持拆解為兩個獨立的子任務進行優(yōu)化。

第一階段(1st Pass):自適應噪聲注入 (AdaNI)

這一階段的目標是“精準變老”。 作者發(fā)現(xiàn),年齡跨度越大,所需的圖像結構變化越劇烈。因此,AdaNI 機制會根據(jù)目標年齡與源年齡的差距,動態(tài)調(diào)整注入潛空間(Latent Space)的噪聲水平 。

小跨度: 注入低噪聲,微調(diào)紋理。

大跨度: 注入高噪聲,允許模型對臉型、皺紋、發(fā)際線進行大刀闊斧的修改。 雖然這一步會犧牲部分身份信息,但它為生成逼真的老化特征奠定了基礎。

第二階段(2nd Pass):身份感知Embedding (IDEmb)

這一階段的目標是“找回身份”。 在第一階段生成的圖像基礎上,模型通過引入 IDEmb 進行去噪引導。IDEmb 由兩個創(chuàng)新模塊組成:

SVR-ArcFace: 傳統(tǒng)ArcFace特征中混雜了年齡信息。作者利用奇異值重加權(Singular Value Reweighting, SVR)技術,抑制特征中隨年齡變化的成分,提取出更純粹的“身份核心” 。

Rotate-CLIP: 既然CLIP文本特征具有方向性,作者提出在CLIP空間中進行“旋轉”(Rotate)。通過球面插值(Slerp)而非簡單的向量相減,平滑地將特征導向目標年齡,同時保留語義一致性 。

達到的效果

平衡的性能

在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 數(shù)據(jù)集上的實驗表明,Cradle2Cane 在 Face++ 和 Qwen-VL 多模態(tài)大模型兩種評估協(xié)議下,均取得了 SOTA 的成績。 特別是在 HCS (Harmonic Consistency Score) 這一綜合指標上,本文方法大幅領先于 SAM, CUSP, FADING 等基線模型 。

自然的視覺效果

無論是皺紋的加深、皮膚的松弛,還是發(fā)色的改變(如變白),Cradle2Cane 都能生成極其自然的細節(jié)。 更重要的是,即使是處理 In-the-wild 的圖片,在面對遮擋、側臉、復雜光照時,該模型仍舊能夠展現(xiàn)不錯的效果。

靈活的應用擴展

得益于兩階段編輯的靈活性,除了單獨改變年齡,該方法還能同步進行人臉屬性編輯。比如該方法可以無縫地應用各種屬性,例如,戴眼鏡、綠色的頭發(fā)、戴帽子,同時持續(xù)地進行年齡增長,顯著提高了生成圖像的多樣性和可控性。

更多結果

總結

Cradle2Cane 的成功證明了在生成式AI時代,針對特定任務的結構化解耦設計依然具有巨大的潛力。通過放棄“一步到位”的傳統(tǒng)思路,采用由粗到精、先年齡遷移再ID增強的策略,南開大學與三星的研究團隊為基于Diffusion的人臉年齡編輯任務提供了一個新的框架,來解決長久存在的“Age-ID trade-off“問題。 這不僅是一次算法的創(chuàng)新,更讓我們看到了AI在數(shù)字娛樂、影視特效甚至尋找走失人口等社會公益領域的廣闊應用前景。

參考文獻

[1] From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging

       原文標題 : NeurIPS`25 | 感嘆歲月神偷!南開&三星開源Cradle2Cane:完美破解“年齡-身份”兩難困境!

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號