學術論文寫作 | (5) Ablation Study

看論文時,在實驗部分經常會出現一個Ablation Study模塊。Ablation Study可以翻譯爲 消融實驗,本篇博客將解釋一下什麼是Ablation Study。

Ablation Study典型的做法是在模型或算法中移除一些“feature”,然後看一下對模型性能的影響。(類似於控制變量法,每次修改一個變量,保持其他變量不動,觀察這個變量對結果/性能的影響)。

例如:

  • LSTM單元有4個門: feature, input, output, forget。我們可能會問所有這4個門都是必要的嗎?如果我去掉其中一個會怎麼樣?實際上,已經對LSTM變體進行了大量實驗,其中GRU是一個著名的例子(更簡單)。
  • 如果一個算法或模型是基於之前的工作進行修改,有一系列的改進,研究者想知道最關鍵的改動是什麼或者證明這些改進是有意義的/有效的。(利用Ablation Study,比較添加某個改進後模型性能和原始模型性能,如果添加後的模型性能有很大的提高,說明這個改進或這個工作是有效、有意義的 )
  • 越簡單越好(Simpler is better.)如果兩個模型可以獲得相同的效果/性能,優先選擇簡單的那一個。(利用Ablation Study,去掉模型的某個/些結構後,性能沒有下降或下降在可接受範圍內,那麼就採用去掉這個結構後的模型,因爲它更簡單)
  • 如果使用了某些技巧來使算法/模型起作用,那麼瞭解該算法/模型對於消除這些技巧後是否強大/魯棒是很有用的。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章