學術論文寫作 | (5) Ablation Study

原創

2020-02-24 16:57

看論文時，在實驗部分經常會出現一個Ablation Study模塊。Ablation Study可以翻譯爲消融實驗，本篇博客將解釋一下什麼是Ablation Study。

Ablation Study典型的做法是在模型或算法中移除一些“feature”，然後看一下對模型性能的影響。（類似於控制變量法，每次修改一個變量，保持其他變量不動，觀察這個變量對結果/性能的影響）。

例如：

LSTM單元有4個門： feature, input, output, forget。我們可能會問所有這4個門都是必要的嗎？如果我去掉其中一個會怎麼樣？實際上，已經對LSTM變體進行了大量實驗，其中GRU是一個著名的例子（更簡單）。
如果一個算法或模型是基於之前的工作進行修改，有一系列的改進，研究者想知道最關鍵的改動是什麼或者證明這些改進是有意義的/有效的。（利用Ablation Study，比較添加某個改進後模型性能和原始模型性能，如果添加後的模型性能有很大的提高，說明這個改進或這個工作是有效、有意義的）
越簡單越好(Simpler is better.)如果兩個模型可以獲得相同的效果/性能，優先選擇簡單的那一個。（利用Ablation Study，去掉模型的某個/些結構後，性能沒有下降或下降在可接受範圍內，那麼就採用去掉這個結構後的模型，因爲它更簡單）
如果使用了某些技巧來使算法/模型起作用，那麼瞭解該算法/模型對於消除這些技巧後是否強大/魯棒是很有用的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.