簡述
文章與神經網絡多輪對話系統一脈相承,文章的主要貢獻在於,將幾種網絡結構的結果集成,取得了好於任一單一網絡的結果。
文章全名:Improved Deep Learning Baselines for Ubuntu Corpus Dialogs
網絡結構
前作的結構可以進一步抽象成
中間的NN可以是CNN, LSTM或Bi-LSTM,對應的圖示爲
其中CNN沿用了CNN用於文本分類中提到的網絡結構,前作的結果,三種結構的結果與集成的結果的對比
單一結構下,LSTM最佳,Bi-LSTM稍差,CNN最差,三者集成之後,有明顯提高。
集成的方法非常簡單,取各單一結構結果的平均。
輸入層用了GloVe產出的詞向量。