必讀論文|20篇聊天機器人領域必讀論文速遞

聊天機器人（Chatbot）是經由對話或文字進行交談的計算機程序。其能夠模擬人類對話，通過圖靈測試。自 1966 年以來人類從未停止過對聊天機器人的探索。現如今，蘋果語音助手 Siri，微軟的小冰、小娜、Rinna、Tay、Zo、Ruk kkuh，亞馬遜的Echo，百度的小度機器人，京東JIMI客服機器人，網易七魚等 Chatbot 紛紛進駐到生活的各個領域，改變着我們的生活。

對話系統和聊天機器人Topic必讀論文

歷史發展脈絡

1966 年，MIT 的計算機科學家 Joseph Weizenbaum 發表了 ELIZA，它可以根據人工設計的腳本與人類交流，是世界上第一個模仿人類談話的機器人；

1971 年，斯坦福大學的 Kenneth Colby 開發出 Parry 聊天機器人，它模仿偏執狂患者，這是第一個通過圖靈測試的聊天機器人；

1988 年，加州大學伯克利分校的 Robert Wilensky 等人開發了名爲 UNIX Consultant 的聊天機器人系統；

1990 年，美國人 Hugh Loebner 設立 Loebner Prize，獎勵首個與人類回覆無差別的計算機程序，即聊天機器人系統；

1995 年，Richard Wallace 博士開發的 ALICE 系統允許用戶自定義自己的聊天機器人，被認爲是 20 世紀最偉大的聊天機器人。ALICE 在 2000、2001 和 2004 年三次斬獲勒布納人工智能獎（Loebner Prize），該獎項頒發給最像人類的系統；

2001 年，SmarterChild 在短信和即時信息中廣泛流行，聊天機器人第一次被應用在即時通信領域；

2006 年，IBM Watson 能夠用自然語言回答問題；

2010 年，蘋果語音助手 Siri 誕生；

之後，全球各大公司開始推出 Chatbots 平臺或開源架構。

必讀論文推薦

Dialog State Tracking: A Neural Reading Comprehension Approach

作者：Shuyang Gao, Abhishek Sethi, Sanchit Agarwal, Tagyoung Chung, Dilek Hakkani-Tur

鏈接：

https://www.aminer.cn/pub/5de0b9f3df1a9c0c41598a75/dialog-state-tracking-a-neural-reading-comprehension-approach

對話狀態追蹤用於在給定所有先前對話的情況下估計當前的對話狀態。機器閱讀理解則側重於構建系統，以讀取文本段落並回答基於段落理解的問題。本篇論文將對話狀態追蹤轉化爲一項機器閱讀理解任務，以基於上下文回答當前的對話狀態是什麼這一問題。傳統的狀態跟蹤方法通常將對話狀態預測爲本體中所有可能的槽值在封閉集合上的分佈，而本文使用簡單的基於注意力的神經網絡來指向對話中的槽值。

Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations

作者：Karthik Gopalakrishnan, Behnam Hedayatnia, Qinlang Chen, Anna Gottardi, Sanjeev Kwatra, Anu Venkatesh, Raefer Gabriel, Dilek Hakkani-Tür

發表：Interspeech Conference

鏈接：

https://www.aminer.cn/pub/5db92b0647c8f7664621a7e6/topical-chat-towards-knowledge-grounded-open-domain-conversations

建立可以與人類進行深層次、開放性對話的社交機器人，是人工智能領域的重大挑戰之一。Amazon 團隊開發的 Topical-Chat 是一個基於知識的人－人之間開放領域對話數據集（Knowledge-Grounded Open-Domain Conversations）。其中的基礎知識涵蓋 8 個廣泛的主題，並且對話夥伴沒有明確定義的角色，有助於對開放域對話式 AI 的進一步研究。本文還在 Topical-Chat 上訓練了幾種最新的編碼器-解碼器對話模型，並使用自動和人工評估以進行基準測試。

MoEL: Mixture of Empathetic Listeners

作者：Zhaojiang Lin, Andrea Madotto, Jamin Shin, Peng Xu, Pascale Fung

鏈接：

https://www.aminer.cn/pub/5db9294b47c8f766461f2f8d/moel-mixture-of-empathetic-listeners

以往對移情對話系統的研究主要關注在特定情緒下產生的反應。但是，產生共情不僅需要具備生成情緒反應的能力，更需要理解用戶的情緒並適當地予以回覆。本篇論文提出全新的基於端到端（End-to-End）在對話系統中建立移情模型的方法：移情聽衆的混合物（MoEL）。這一模型首先捕獲用戶的情緒並輸出情緒分佈。基於此，MoEL 將結合優化後的偵聽器的對某些情緒做出的反應，從而產生移情。

Ethical Challenges in Data-Driven Dialogue Systems

作者：Peter Henderson, Koustuv Sinha, Nicolas Angelard-Gontier, Nan Rosemary Ke, Genevieve Fried, Ryan Lowe, Joelle Pineau

發表：In the 2018 AAAI/ACM Conference on AI, Ethics, and Society

鏈接：

https://www.aminer.cn/pub/5a4aef9e17c44a2190f7a8b1/ethical-challenges-in-data-driven-dialogue-systems

本篇論文重點介紹對話系統研究中可能出現的道德問題，包括：數據驅動系統中的隱性偏見、對抗性示例的出現、潛在的隱私侵犯源、安全問題，強化學習系統的特殊考慮以及可複製性問題等。

MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling

作者：Pawel Budzianowski, Tsung-Hsien Wen, Bo-Hsiang Tseng, Iñigo Casanueva, Stefan Ultes, Osman Ramadan, Milica Gasic

鏈接：

https://www.aminer.cn/pub/5bdc315017c44a1f58a05b9f/multiwoz-a-large-scale-multi-domain-wizard-of-oz-dataset-for-task

儘管機器學習已成爲對話研究界的主要場景，但真正的突破已被可用數據的規模所阻礙。爲了解決這個基本障礙，本篇論文引入了 Multi-Domain Wizard-of-Oz 數據集（MultiWOZ），這是一個跨越多個領域和主題的完全標記的人與人的書面對話數據集。它的對話數量達到了 10k，比所有先前註釋的面向任務的語料庫大至少一個數量級。除了是標有對話信念狀態和對話行爲的開源數據集之外，這項工作的貢獻有兩方面：首先，提供數據收集程序的詳細描述以及數據結構和分析的摘要。數據收集渠道完全基於衆包，無需聘請專業註釋人員；其次，報告了一組信念跟蹤，對話行爲和回覆生成的基準結果，顯示了數據的可用性，併爲未來的研究設定了基線。

A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version

作者：Iulian Vlad Serban, Ryan Lowe, Peter Henderson, Laurent Charlin, Joelle Pineau

發表：Dialogue & Discourse

鏈接：

https://www.aminer.cn/pub/5b3d98bd17c44a510f800274/a-survey-of-available-corpora-for-building-data-driven-dialogue-systems-the

本篇論文告訴我們目前有哪些可用於對話生成系統的開源數據集，並且分析了它們各自的重要特性，以及該如何使用他們。此外討論了它們除了對話系統外的其他用途，以及這些數據集對應的檢測方法。

The Design and Implementation of XiaoIce, an Empathetic Social Chatbot

作者：Li Zhou, Jianfeng Gao, Di Li, Heung-Yeung Shum

發表：Computational Linguistics

鏈接：

https://www.aminer.cn/pub/5c5ce50d17c44a400fc38d54/the-design-and-implementation-of-xiaoice-an-empathetic-social-chatbot

這是由微軟研究員發表的關於智能語音助手小冰的論文。小冰是一個獨特的人工智能伴侶，具有情感聯繫，滿足人類對交流、感情和社會歸屬的需求。本篇論文在系統設計中考慮了智商和情商，將人機社交聊天作爲馬爾可夫決策過程（MDP）的決策，並優化了小冰的長期用戶參與度和預期的每次會話對話。本篇文章詳細介紹了系統架構和關鍵組件，包括對話管理器、核心聊天、技能和移情計算模塊；並展示了小冰如何動態識別人類的感受和狀態，理解用戶意圖，並在長時間的對話中響應用戶需求。

A Network-based End-to-End Trainable Task-oriented Dialogue System

作者：Lina Maria Rojas-Barahona,Milica Gasic, Nikola Mrksic, Pei-Hao Su, Stefan Ultes, Tsung-Hsien Wen, Steve J. Young, David Vandyke

鏈接：

https://www.aminer.cn/pub/59ae3c3a2bbe271c4c71fcd9/a-network-based-end-to-end-trainable-task-oriented-dialogue-system

讓機器去和人類自然的交談是具有挑戰性的。最近的任務型對話系統需要創造幾個部分並且通常這需要大量的人工干預，或者需要標註數據去解決各部分訓練的問題。本篇論文提出了一種端到端的任務型對話系統（End-to-End trainable system），它採取了一種基於管道框架的新穎的收集對話數據的方法。這個方法確保輕鬆實現對話系統而不用過多的人工干預。

Neural Belief Tracker: Data-Driven Dialogue State Tracking

作者：Nikola Mrksic, Diarmuid Ó Séaghdha, Tsung-Hsien Wen, Blaise Thomson, Steve J. Young

鏈接：

https://www.aminer.cn/pub/57a4e921ac44365e35c9913a/neural-belief-tracker-data-driven-dialogue-state-tracking

現代口語對話系統的核心組成部分之一是 belief tracker，它可以在對話的每一步估計用戶的目標。然而，目前大多數方法難以擴展到更大、更復雜的對話領域。這是由於他們依賴：a）口語理解（Spoken Language Understanding，SLU）模型，需要大量註釋的訓練數據；或者 b）手工製作的詞彙表，用於捕捉用戶語言中的一些詞語變種。本篇論文提出了一個新的 Neural Belief Tracking（NBT）框架，通過將模型建立在表徵學習上以此克服了這些問題。NBT 模型對預訓練的詞向量進行推理，學習將它們組合成用戶話語和對話上下文的分佈式表示。

Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses

作者：Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier, Yoshua Bengio, Joelle Pineau

鏈接：

https://www.aminer.cn/pub/59ae3c262bbe271c4c71ea58/towards-an-automatic-turing-test-learning-to-evaluate-dialogue-responses

本篇論文使用語境和真實反應來對模型生成的反應進行打分，並和人類打分的分值進行比較，從而達到一種自動進行圖靈檢測效果。訓練出來的模型可以生成符合人類判斷、能回答輸入語句的對話。在給定地面實況的情況下，以往的工作都是計算生成話語和地面實況的相似性（包括字面上、語義上），本篇論文從人的理解角度出發，對生成的反應進行度量。

Adversarial Learning for Neural Dialogue Generation

作者：Jiwei Li, Will Monroe, Tianlin Shi, Alan Ritter, Dan Jurafsky

鏈接：

https://www.aminer.cn/pub/58d82fcbd649053542fd6082/adversarial-learning-for-neural-dialogue-generation

To Plan or not to Plan? Discourse Planning in Slot-Value Informed Sequence to Sequence Models for Language Generation

作者：Neha Nayak, Dilek Hakkani-Tür, Marilyn A. Walker, Larry P. Heck

發表：Interspeech Conference

鏈接：

https://www.aminer.cn/pub/5a73cb6317c44a0b30358265/to-plan-or-not-to-plan-discourse-planning-in-slot-value-informed

Training End-to-End Dialogue Systems with the Ubuntu Dialogue Corpus

作者：Ryan Thomas Lowe, Nissan Pow, Iulian Vlad Serban, Laurent Charlin, Chia-Wei Liu, Joelle Pineau

發表：Dialogue & Discourse