看論文時,在實驗部分經常會出現一個Ablation Study模塊。Ablation Study可以翻譯爲 消融實驗,本篇博客將解釋一下什麼是Ablation Study。
Ablation Study典型的做法是在模型或算法中移除一些“feature”,然後看一下對模型性能的影響。(類似於控制變量法,每次修改一個變量,保持其他變量不動,觀察這個變量對結果/性能的影響)。
例如:
- LSTM單元有4個門: feature, input, output, forget。我們可能會問所有這4個門都是必要的嗎?如果我去掉其中一個會怎麼樣?實際上,已經對LSTM變體進行了大量實驗,其中GRU是一個著名的例子(更簡單)。
- 如果一個算法或模型是基於之前的工作進行修改,有一系列的改進,研究者想知道最關鍵的改動是什麼或者證明這些改進是有意義的/有效的。(利用Ablation Study,比較添加某個改進後模型性能和原始模型性能,如果添加後的模型性能有很大的提高,說明這個改進或這個工作是有效、有意義的 )
- 越簡單越好(Simpler is better.)如果兩個模型可以獲得相同的效果/性能,優先選擇簡單的那一個。(利用Ablation Study,去掉模型的某個/些結構後,性能沒有下降或下降在可接受範圍內,那麼就採用去掉這個結構後的模型,因爲它更簡單)
- 如果使用了某些技巧來使算法/模型起作用,那麼瞭解該算法/模型對於消除這些技巧後是否強大/魯棒是很有用的。