點擊下方“AI算法與圖像處理”,一起進步!
重磅乾貨,第一時間送達
來源:機器之心
來自微軟、浙江大學等機構的研究者提出了一種 one-shot DNN 剪枝框架,無需微調即可從大型神經網絡中得到輕量級架構,在保持模型高性能的同時還能顯著降低所需算力。
One-Shot 訓練和剪枝。研究者提出了一個名爲 OTO(Only-Train-Once)的 one-shot 訓練和剪枝框架。它可以將一個完整的神經網絡壓縮爲輕量級網絡,同時保持較高的性能。OTO 大大簡化了現有剪枝方法複雜的多階段訓練 pipeline,適合各種架構和應用,因此具有通用性和有效性。
Zero-Invariant Group(ZIG)。研究者定義了神經網絡的 zero-invariant group。如果一個框架被劃分爲 ZIG,它就允許我們修剪 zero group,同時不影響輸出,這麼做的結果是 one-shot 剪枝。這種特性適用於全連接層、殘差塊、多頭注意力等多種流行結構。
新的結構化稀疏優化算法。研究者提出了 Half-Space Stochastic Projected Gradient(HSPG),這是一種解決引起正則化問題的結構化稀疏的方法。研究團隊在實踐中展示並分析了 HSPG 在促進 zero group 方面表現出的優勢(相對於標準近端方法)。ZIG 和 HSPG 的設計是網絡無關的,因此 OTO 對於很多應用來說都是通用的。
實驗結果。利用本文中提出的方法,研究者可以從頭、同時訓練和壓縮完整模型,無需爲了提高推理速度和減少參數而進行微調。在 VGG for CIFAR10、ResNet50 for CIFAR10/ImageNet 和 Bert for SQuAD 等基準上,該方法都實現了 SOTA 結果。
個人微信(如果沒有備註不拉羣!)
請註明:
地區+學校/企業+研究方向+暱稱
下載1:何愷明頂會分享
在「AI算法與圖像處理」公衆號後臺回覆:何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經典工作的總結分析
下載2:終身受益的編程指南:Google編程風格指南
在「AI算法與圖像處理」公衆號後臺回覆:c++,即可下載。歷經十年考驗,最權威的編程規範!
下載3 CVPR2021
在「AI算法與圖像處理」公衆號後臺回覆:
CVPR
,即可下載1467篇CVPR 2020論文 和 CVPR 2021 最新論文
本文分享自微信公衆號 - AI算法與圖像處理(AI_study)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。