論文閱讀：Few-shot Natural Language Generation for Task-Oriented Dialog

原創

咕噜咕噜day

2020-07-03 22:04

paper：https://arxiv.org/abs/2002.12328

code/data/demo：http://scgpt.westus2.azurecontainer.io/

目前任務導向型對話存在的問題，要麼依賴固定對話生成的模型，要麼只能在一些具體領域的基於一些有限標註數據集進行訓練。本文提出了一個基於”預訓練-預訓練-微調”的模型，目的是提高任務導向型對話生成的文本的流暢性和準確度；

流程是首先在通用語料上預訓練，然後在大量對話數據集上預訓練，最後再使用具體領域的數據集進行微調，能極大地提高所生成回覆的質量。

SC-GPT和兩個基線模型（SC-LSTM、GPT-2）的實驗結果：可以看到，在所有7個領域，SC-GPT生成的文本既更流暢（BLEU更大），而且也更準確（ERR更小），超越幅度也非常大。

paper note:https://zhuanlan.zhihu.com/p/110164562

針對Few-shot 的應用場景，可以借鑑作者的基於”預訓練-預訓練-微調”的方法，並且代碼也以及開源；

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

論文閱讀：CTRL: A CONDITIONAL TRANSFORMER LANGUAGE MODEL FOR CONTROLLABLE GENERATION

核心思想：借鑑多任務，將文本標籤作爲輸入的一部分（放在開頭）控制文本生成。文本生成最大的問題是難以對其進行控制，本文發佈了一個 1.6 billion 參數的條件 transformer language model，訓練能夠 gove

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Keywords-Guided Abstractive Sentence Summarization

這篇文章講的是把關鍵詞信息添加到摘要生成的encoder-decoder中，具體是通過一個訓練進行關鍵詞提取和摘要生成的多任務學習框架；通過雙注意和雙複製機制對指針生成網絡進行擴展，實現了輸入語句和關鍵詞的語義集成，實現輸入語句和關鍵詞的

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Automatic Generation of Personalized Comment Based on User Profile

文章鏈接：https://arxiv.org/abs/1907.10371 code：https://github.com/Walleclipse/AGPC 本文作者提出一種基於用戶個性化信息來生成評論的方法；個性化信息如下：

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Large-Scale Transfer Learning for Natural Language Generation

遷移學習的思路是：先在大規模的未標註文本語料上無監督地預訓練一個語言模型，再把預訓練好的語言模型遷移到特定的任務上，對模型參數進行微調。目前遷移學習的大部分研究集中在文本分類和NLU(natural language understand

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Unsupervised Paraphrasing without Translation

咕噜咕噜day

2020-05-31 05:24:20

論文閱讀：Generating Abstractive Summaries with Finetuned Language Models

咕噜咕噜day

2020-05-31 05:24:19

論文閱讀：Negative Lexically Constrained Decoding for Paraphrase Generation

咕噜咕噜day

2020-05-31 05:24:19

論文閱讀：Text-to-Text Pre-Training for Data-to-Text Tasks

咕噜咕噜day

2020-05-31 05:24:19

論文閱讀：Generating Fluent Adversarial Examples for Natural Languages

咕噜咕噜day

2020-05-31 05:24:19

論文閱讀：Neural Machine Translation with Byte-Level Subwords

咕噜咕噜day

2020-05-31 05:24:19

論文閱讀：Dual Supervised Learning for Natural Language Understanding and Generation

咕噜咕噜day

2020-05-25 13:17:19

論文閱讀：CTRL: A CONDITIONAL TRANSFORMER LANGUAGE MODEL FOR CONTROLLABLE GENERATION

核心思想：借鑑多任務，將文本標籤作爲輸入的一部分（放在開頭）控制文本生成。文本生成最大的問題是難以對其進行控制，本文發佈了一個 1.6 billion 參數的條件 transformer language model，訓練能夠 gove

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Keywords-Guided Abstractive Sentence Summarization

這篇文章講的是把關鍵詞信息添加到摘要生成的encoder-decoder中，具體是通過一個訓練進行關鍵詞提取和摘要生成的多任務學習框架；通過雙注意和雙複製機制對指針生成網絡進行擴展，實現了輸入語句和關鍵詞的語義集成，實現輸入語句和關鍵詞的

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Automatic Generation of Personalized Comment Based on User Profile

文章鏈接：https://arxiv.org/abs/1907.10371 code：https://github.com/Walleclipse/AGPC 本文作者提出一種基於用戶個性化信息來生成評論的方法；個性化信息如下：

咕噜咕噜day

2020-07-03 22:04:47

論文閱讀：Large-Scale Transfer Learning for Natural Language Generation

遷移學習的思路是：先在大規模的未標註文本語料上無監督地預訓練一個語言模型，再把預訓練好的語言模型遷移到特定的任務上，對模型參數進行微調。目前遷移學習的大部分研究集中在文本分類和NLU(natural language understand

咕噜咕噜day

2020-07-03 22:04:47

24小時熱門文章

最新文章

最新評論文章