QA問題

1.文章採用Document Retriever + Document Reader, 其中Document Retriever的問題是從Wikipedia抽取出相關的文檔或段落,然後利用Document Reader進行閱讀理解。

2.Document Retriever採用的是TFIDF,Document Reader採用的是Bi-LSTM

3.Document Retriever會檢索到不包含答案的段落,從而加入了加入了Paragraph ranking,對檢索到的Paragraph,根據問題embedding和段落embedding的相似性進行排序,只讀前M個段落。

4.採用Paragraph Selector對檢索到的段落進行過濾。

5.RETRIEVER和READER的多步交互,根據Reader的狀態對query進行更新,更新的query用來重新檢索段落,迭代多步後輸出最後一步檢索閱讀後產生的答案。

6.設計了RETRIEVER和READER的多步交互,根據Reader的狀態對query進行更新,更新的query用來重新檢索段落,迭代多步後輸出最後一步檢索閱讀後產生的答案。

7.沒有考慮到段落之間的聯繫。由於正確答案往往有多個證據(evidence),而錯誤答案只有個別證據。所以進行了融合。

8.在模型上也有不同的改進。由於之前的模型[1,2],問題和段落交互很少,都是將問題編碼成問題向量,段落編碼成段落向量然後進行(單層)交互。[5]提出對問題和段落編碼的各個層進行全連接交互。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章