谷歌正式開源Model Search！自動優化並識別AI模型，最佳模版唾手可得

原創

2021-03-22 18:35

$\"圖片\"$

$\"圖片\"$

"}}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":"center","origin":null},"content":[{"type":"text","marks":[{"type":"size","attrs":{"size":10}}],"text":"網絡在多項實驗中不斷進化的示例。每種顏色代表不同類型的架構塊。最終網絡是由高性能候選網絡變異而來，在此示例中的變異爲增加網絡深度。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"爲了進一步提高效率與準確性，還可以在不同內部實驗之間進行遷移學習。Model Search通過兩種方式實現遷移學習 — 知識蒸餾或權重共享，從先前訓練完成的模型中推導出可供後續模型使用的某些變量。以此爲基礎，即可顯著加快學習速度並有望快速擴展出性能更強的架構選項。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"知識蒸餾旨在增加與基礎模型實際情況相匹配的損失項以提高候選對象的準確性，這些損失項應與高性能模型的預測結果相匹配。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另一方面，權重共享則直接從以往訓練完成的模型中複製合適的權重，並對其餘權重部分進行隨機初始化，藉此爲變異後的新網絡提供參數搭配指引。這種方式不僅有助於加快訓練速度，同時也能帶來更多性能更好的架構選項。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在Model Search運行完成之後，客戶即可檢查搜索得出的大量模型選項。此外，客戶也可以生成自己的個人搜索空間，藉此進一步選取模型中的自定義架構組件。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"實驗結果"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Model Search成功以最少的迭代次數實現了生產模型改進。在最近發表的論文中，谷歌以關鍵詞發現與語言識別模型爲例，演示了Model Search在語音領域的實際效能。只需要不到200次迭代，其生成的模型就已經略優於專家設計的內部最新生產模型，且訓練參數的數量也由後者的31萬5千條降低至18萬4千條。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"embedcomp","attrs":{"type":"table","data":{"content":"

$\"圖片\"$

"}}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":"center","origin":null},"content":[{"type":"text","marks":[{"type":"size","attrs":{"size":10}}],"text":"與原有關鍵字發現生產模型相比，我們通過系統迭代得到的模型擁有更高的準確性。在同一篇論文中，語言識別測試也得出了類似的結論。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"谷歌還在得到廣泛使用的CIFAR-10成像數據集上使用Model Search，希望找到最適合的圖像分類架構。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"通過一組已知的卷積塊——包括卷積、Resnet塊（即兩個卷積加一條skip連接）、NAS-A單元、全連接層等，谷歌觀察到Model Search能夠在短短209次試驗（僅探索209個模型）後迅速達成91.83的基準準確性。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"相比之下，NasNet算法（強化學習）需要5807次試驗、PNAS（強化學習加漸進式學習）需要1160次試驗，才能達到相同的模型性能。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"總結"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"谷歌公司調查工程師Hanna Mazzawi與調查科學家Xavi Gonzalvo在博文中寫道，“我們希望Model Search代碼能夠爲研究人員們提供一套靈活且具有領域中立性的框架，幫助他們輕鬆發現良好的機器學習模型。以特定領域的已有知識爲基礎，我們相信這套框架將迸發出巨大的能量，在由標準構建塊組成的搜索空間之內爲各類現實問題選取性能最強的模型選項。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"italic"},{"type":"size","attrs":{"size":10}}],"text":"原文鏈接："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/ai.googleblog.com\/2021\/02\/introducing-model-search-open-source.html","title":"","type":null},"content":[{"type":"text","marks":[{"type":"italic"}],"text":"https:\/\/ai.googleblog.com\/2021\/02\/introducing-model-search-open-source.html"}],"marks":[{"type":"italic"},{"type":"size","attrs":{"size":10}}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/venturebeat.com\/2021\/02\/19\/googles-model-search-automatically-optimizes-and-identifies-ai-models\/","title":"","type":null},"content":[{"type":"text","marks":[{"type":"italic"}],"text":"https:\/\/venturebeat.com\/2021\/02\/19\/googles-model-search-automatically-optimizes-and-identifies-ai-models\/"}],"marks":[{"type":"italic"},{"type":"size","attrs":{"size":10}}]}]},{"type":"heading","attrs":{"align":null,"level":4}}]}