CVPR 2020: SGAS,一種基于貪心思想的CNN/GCN網(wǎng)絡(luò)結(jié)構(gòu)搜索算法
SGAS詳細方案
針對退化的搜索評估相關(guān)性這一重要的問題,我們提出了SGAS(SequentialGreedy Architecture Search),一種順序貪心決策的搜索算法。
圖2 SGAS的網(wǎng)絡(luò)結(jié)構(gòu)搜索示意圖
我們基于貪心算法的思想將網(wǎng)絡(luò)結(jié)構(gòu)的搜索問題,轉(zhuǎn)化為逐步地選擇一條邊并確定其運算的子問題。實驗證明,依次解決這些簡單的子問題,可以讓最終結(jié)構(gòu)具有更高的搜索-測試相關(guān)性。算法的迭代過程如算法1所示。
在每個決策時期,我們根據(jù)預(yù)先確定的選擇標(biāo)準選擇一條邊(i^{+}, j^{+})。通過用公式(3)得到這條邊的運算,并替換相應(yīng)的混合運算o^{ar}。所選擇的運算,即是所選的邊基于貪心的最優(yōu)選擇。每當(dāng)確定好一條邊的運算,我們就不再需要這條邊的結(jié)構(gòu)參數(shù)lpha(i^{+}, j^{+}))以及混合操作中其余路徑的權(quán)重,我們可以將這條邊從后續(xù)的優(yōu)化中去除。這樣可以帶給我們一個額外的好處是:優(yōu)化問題得到了剪枝,進而可以提高搜索的效率。一條邊被剪枝后,剩下的超網(wǎng)絡(luò)以及參數(shù)形成一個新的子問題,該子問題將被以相同的算法迭代求解。在搜索階段的最后,便得到一個沒有權(quán)重共享的離散子網(wǎng)絡(luò),如圖2所示。SGAS算法基于順序貪心算法,減少了在搜索階段和評價階段的模型不一致性和權(quán)重共享的副作用,使得模型的搜索-測試相關(guān)性最大化。
在SGAS中,選擇標(biāo)準的設(shè)計至關(guān)重要。我們考慮影響邊的選擇的三個重要因素:邊的重要性,選擇確定性和選擇穩(wěn)定性。
邊的重要性:如果這條邊的非零運算選擇的可能性越高,表明這條邊越重要。
選擇確定性:熵(entropy)是分布用度量不確定性的常。非零運算的歸一化權(quán)重可以看作是一種分布:
我們將選擇確定性定義為一減去操作分布的歸一化熵:
選擇穩(wěn)定性:為了讓選擇更穩(wěn)定,我們需要考慮選擇確定性的歷史分布。直方圖相交[48]是檢測分布變化的常用方法,我們利用直方圖相交來計算第T步中的前K時間的邊的平均選擇穩(wěn)定性:

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 2 黃仁勛:與雷軍長期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化
- 5 六大國產(chǎn)大模型,誰是最強“金融分析師”?|錦緞評測
- 6 2025年第一支10倍股,來了!
- 7 募資39.85億元!寒武紀押注大模型芯片與軟件平臺
- 8 國內(nèi)免費版Deep Research上線,秘塔AI深度研究嘗試重塑知識工作范式
- 9 清華跑出具身智能獨角獸:給機器人安上眼睛和大腦,融資近20億
- 10 清庫存?曝英偉達H20供應(yīng)有限,且沒有復(fù)產(chǎn)計劃