任務

multiple-choice question answering tasks. 每個樣本包含上下文 $c$ 、問題 $q$ 和幾個答案選項 $a^k_{i=1}$ 。作者一共選取了5個數據集進行實驗。示例如下：

Model

作者設計了三種模型進行實驗，下面依次介紹。

LM-only Baseline

作者把每個答案選項 $a_i$ 與上下文 $c$ ，問題 $q$ 進行結合，組成選項 $opt_i=combine(c,q,a_i)$ . $opt_i$ 是一句自然語言形式的文本，每個候選答案的得分 $score(a_i)=CE(opt_i)$ . $CE$ (cross-entropy loss)的定義如下：
$CE(t_1...t_n)=-1/n \sum_{i=1}^nlog_2 p_{\Bbb L \Bbb M_s}(t_i|t_1...t_{i-1})$
$\Bbb L \Bbb M_s$ 是預訓練語言模型， $CE$ 值最低的就是正確的答案。

Baseline Model with External Knowledge

每個實例都有一個clarification list: $CL=\{cl_1,...,cl_m\}$ 。每個clarification都是一個與問題相關知識的文本片段（怎麼來的在後面介紹)。因爲（作者假設）在回答某個問題時只依賴於一個clarification，所以某個候選答案的得分就是最支持該答案的clarification的分數：
$score(a_i)=min_{cl\in CL}CE(opt_i+cl) \\y=argmin_iscore(a_i)$
作者通過下圖所示的方法從三個不同類型的知識庫（ConceptNet, Google Ngrams, COMET）中生成clarification list：

Self-talk Model

這個方法的思路和上一個一樣，只不過生成clarification的方法不同。即通過用預訓練語言模型生成clarification達到從預訓練語言模型中提取知識的目的。生成clarification的過程分爲下面幾步：

根據上下文和問題前置（question prefixes 事先定義好的）生成clarification question
每個prefix生成5個問題
生成答案（也就是clarification)
作者使用context、clarification question和answer prefix的拼接作爲prompt來生成答案。爲每個問題都保留10個回答。

Result

不如有監督訓練的模型，但在無監督的方法中算比較好的

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Unsupervised Commonsense Question Answering with Self-Talk 閱讀筆記

任務

Model

LM-only Baseline

Baseline Model with External Knowledge

Self-talk Model

Result

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

基於機器學習技術實現一個醫學輔助診斷的專家系統原型

劍指offer7——兩個棧實現隊列

Learning to Ask Good Questions筆記

DKN: Deep Knowledge-Aware Network for News Recommendation閱讀筆記

Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader閱讀筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結