常識庫與常識推理

常識庫整理

Cyc

概述

始於1984年,由Douglas Lenat推動,旨在收集生活中常識知識並將其編碼集成到一個全面的本體知識庫。該知識庫中包含了320萬條人類定義的斷言,涉及30萬個概念,15000個謂詞。這些資源都採取CycL語言來進行描述,該語言採取謂詞代數描述,語法上與Lisp程序設計語言類似。

Cyc知識庫中表示的知識一般形如“每棵樹都是植物”,“植物最終都會死亡”。當提出“樹是否會死亡”的問題時,推理引擎可以得到正確的結論,並回答該問題。

發佈版本:2009年7月發佈的OpenCyc 2.0版,包含了47000個概念、306000個事實,主要是分類斷言,並不包含Cyc中的複雜規則。

評價:“人工智能歷史上最有爭議的項目”之一。該系統在深度和廣度上都有待完善,且不便於初學者學習使用該系統。

資料

論文
詳細介紹

ConceptNet

概述

常識知識庫。最早源於MIT媒體實驗室的Open Mind Common Sense(OMCS)項目。OMCS項目是由著名AI專家Marvin Minsky於1999年創立。ConceptNet還有其他來源:Wiktionary、WordNet、OpenCyc、DBPedia、JMDict。以三元組形式的關係型知識構成。ConceptNet5版本已經包含有2800萬關係描述。

與Cyc相比,ConceptNet採用了非形式化、更加接近自然語言的描述;與鏈接數據和谷歌知識圖譜相比,ConceptNet比較側重於詞與詞之間的關係。與WordNet相比,包含的關係類型多。ConceptNet完全免費開放,並支持多種語言。

以bicycle爲例如下:

在這裏插入圖片描述

資料

論文全文
demo
論文代碼
中文數據

Commonsense QA

基於ConceptNet開發的常識比賽

舉例:Q:哪個最大? A1:山, A2:人, A3:老鼠。

特點:完全基於常識,幾乎不考慮上下文的閱讀理解。

ATOMIC

概述

原子因果常識圖譜,包含870k條推理常識,專注於“if…then"關係的知識。

比如:事件“x防禦了y的攻擊”,我們能夠馬上推理出 x的動機是“保護自己”、 x這麼做的先決條件是接受了一定的防身技巧、 x可能的特點是強壯勇敢。事件的結果可能是: x會感覺生氣並報警、 y可能會覺得害怕並想要逃走。

ATOMIC:An Atlas of Machine Commonsense for If-Then Reasoning

Social IQA

第一個面向社會情況常識推理的大規模基準,包含38000個覆蓋日常情形中社交情感和智慧的多選題。(涵蓋了關於在情境中描述人們的行爲的各種類型的推斷)

比如:Q:喬丹想告訴特雷西一個祕密,所以喬丹向特雷西靠近,爲什麼喬丹這麼做?

A:爲了保證別人聽不到。B:喬丹喜歡特雷西。 C:喬丹想打特雷西。

Social IQA:Commonsense Reasoning about Social Interactions

SQuAD

該數據集包含 100k個(問題,原文,答案)三元組,原文來自於 536 篇維基百科文章,而問題和答案的構建主要是通過衆包的方式,讓標註人員提出最多 5 個基於文章內容的問題並提供正確答案,且答案出現在原文中。

特點: 僅需要閱讀材料的上下文,不需要常識

SQuAD閱讀理解模型總結

Cosmos QA

Cosmos QA是一個35.6K問題的大規模數據集,需要基於常識的閱讀理解,被表述爲多項選擇題。 它着重於閱讀人們日常敘事的不同線條之間的界限,詢問有關事件的可能原因或影響的問題,這些事件需要推理超出上下文的確切範圍。

特點:既需要上下文,同時需要常識的閱讀理解數據集。

Cosmos QA:Machine reading comprehension with contextual commonsense reasoning

COMET

基於 ConceptNet 和 ATOMIC 自動常識知識構建模型

COMET:Commonsense Transformers for Automatic Knowledge Graph Construction

WIQA

第一個大規模測試程序文本推理的大型數據集。 WIQA包含爲379個段落準備的40.7k問題。爲了有效的創建問題,人們爲這379個段落創建了2107個影響圖(IGs),描述一個擾動如何正面或負面影響另一個。

舉例:

事件:海洋侵蝕

過程:1)風在海洋中產生波浪

2)海浪衝刷到海灘上

3)海浪襲擊了海灘上的岩石

4)岩石的微小部分折斷了

5)岩石變小了

舉例:給出一個關於海灘侵蝕的段落,暴風雨的天氣會導致或多或少的侵蝕(或沒有影響)嗎?

WIQA:A dataset for ‘what if…’ reasoning over procedural text

PIQA

物理常識推理的任務以及相應的基準數據集。

舉例:Q:如何用一個瓶子將蛋清和蛋白分開?A1:…。A2:…。

PIQA:Reasoning about physical commonsense in natural language

AI2

在常識庫的構建上,艾倫人工智能研究所(Allen Institute for AI)作出了不同尋常的貢獻。

關於常識推理的一點想法

查閱了幾天相關的資料,感覺有一句話我深爲認同:

我們能期待具有常識的軟件能做什麼?這是很難去定義的,因爲它包含着許許多多的小片段,而所有的一切都很容易單獨進行編程。例如,如果你躺在地上大喊“我受傷了”,常識會讓我們呼叫急救服務……但有可能,蘋果的Siri已經能夠做到這一點。

但是,也正因爲如此,機器若想真正具備認知智能,常識又是如此的重要。

衷心希望前赴後繼的勇士們一點一點啃下這個硬骨頭。奧利給!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章