常識庫與常識推理

常識庫整理

Cyc

概述

始於1984年，由Douglas Lenat推動，旨在收集生活中常識知識並將其編碼集成到一個全面的本體知識庫。該知識庫中包含了320萬條人類定義的斷言，涉及30萬個概念，15000個謂詞。這些資源都採取CycL語言來進行描述，該語言採取謂詞代數描述，語法上與Lisp程序設計語言類似。

Cyc知識庫中表示的知識一般形如“每棵樹都是植物”，“植物最終都會死亡”。當提出“樹是否會死亡”的問題時，推理引擎可以得到正確的結論，並回答該問題。

發佈版本：2009年7月發佈的OpenCyc 2.0版，包含了47000個概念、306000個事實，主要是分類斷言，並不包含Cyc中的複雜規則。

評價：“人工智能歷史上最有爭議的項目”之一。該系統在深度和廣度上都有待完善，且不便於初學者學習使用該系統。

資料

論文
 詳細介紹

ConceptNet

概述

常識知識庫。最早源於MIT媒體實驗室的Open Mind Common Sense（OMCS）項目。OMCS項目是由著名AI專家Marvin Minsky於1999年創立。ConceptNet還有其他來源：Wiktionary、WordNet、OpenCyc、DBPedia、JMDict。以三元組形式的關係型知識構成。ConceptNet5版本已經包含有2800萬關係描述。

與Cyc相比，ConceptNet採用了非形式化、更加接近自然語言的描述；與鏈接數據和谷歌知識圖譜相比，ConceptNet比較側重於詞與詞之間的關係。與WordNet相比，包含的關係類型多。ConceptNet完全免費開放，並支持多種語言。

以bicycle爲例如下：

資料

論文全文
 demo
論文代碼
 中文數據

Commonsense QA

基於ConceptNet開發的常識比賽

舉例：Q：哪個最大？ A1：山， A2：人， A3：老鼠。

特點：完全基於常識，幾乎不考慮上下文的閱讀理解。

ATOMIC

概述

原子因果常識圖譜，包含870k條推理常識，專注於“if…then"關係的知識。

比如：事件“x防禦了y的攻擊”，我們能夠馬上推理出 x的動機是“保護自己”、 x這麼做的先決條件是接受了一定的防身技巧、 x可能的特點是強壯勇敢。事件的結果可能是： x會感覺生氣並報警、 y可能會覺得害怕並想要逃走。

ATOMIC：An Atlas of Machine Commonsense for If-Then Reasoning

Social IQA

第一個面向社會情況常識推理的大規模基準，包含38000個覆蓋日常情形中社交情感和智慧的多選題。（涵蓋了關於在情境中描述人們的行爲的各種類型的推斷）

比如：Q：喬丹想告訴特雷西一個祕密，所以喬丹向特雷西靠近，爲什麼喬丹這麼做？

A：爲了保證別人聽不到。B：喬丹喜歡特雷西。 C：喬丹想打特雷西。

Social IQA：Commonsense Reasoning about Social Interactions

SQuAD

該數據集包含 100k個（問題，原文，答案）三元組，原文來自於 536 篇維基百科文章，而問題和答案的構建主要是通過衆包的方式，讓標註人員提出最多 5 個基於文章內容的問題並提供正確答案，且答案出現在原文中。

特點：僅需要閱讀材料的上下文，不需要常識

SQuAD閱讀理解模型總結

Cosmos QA

Cosmos QA是一個35.6K問題的大規模數據集，需要基於常識的閱讀理解，被表述爲多項選擇題。它着重於閱讀人們日常敘事的不同線條之間的界限，詢問有關事件的可能原因或影響的問題，這些事件需要推理超出上下文的確切範圍。

特點：既需要上下文，同時需要常識的閱讀理解數據集。

Cosmos QA：Machine reading comprehension with contextual commonsense reasoning

COMET

基於 ConceptNet 和 ATOMIC 自動常識知識構建模型

COMET：Commonsense Transformers for Automatic Knowledge Graph Construction

WIQA

第一個大規模測試程序文本推理的大型數據集。 WIQA包含爲379個段落準備的40.7k問題。爲了有效的創建問題，人們爲這379個段落創建了2107個影響圖（IGs），描述一個擾動如何正面或負面影響另一個。

舉例：

事件：海洋侵蝕

過程：1）風在海洋中產生波浪

2）海浪衝刷到海灘上

3）海浪襲擊了海灘上的岩石

4）岩石的微小部分折斷了

5）岩石變小了

舉例：給出一個關於海灘侵蝕的段落，暴風雨的天氣會導致或多或少的侵蝕（或沒有影響）嗎？

WIQA：A dataset for ‘what if…’ reasoning over procedural text

PIQA

物理常識推理的任務以及相應的基準數據集。

舉例：Q：如何用一個瓶子將蛋清和蛋白分開？A1：…。A2：…。

PIQA：Reasoning about physical commonsense in natural language

AI2

在常識庫的構建上，艾倫人工智能研究所(Allen Institute for AI)作出了不同尋常的貢獻。

關於常識推理的一點想法

查閱了幾天相關的資料，感覺有一句話我深爲認同：

我們能期待具有常識的軟件能做什麼？這是很難去定義的，因爲它包含着許許多多的小片段，而所有的一切都很容易單獨進行編程。例如，如果你躺在地上大喊“我受傷了”，常識會讓我們呼叫急救服務……但有可能，蘋果的Siri已經能夠做到這一點。

但是，也正因爲如此，機器若想真正具備認知智能，常識又是如此的重要。

衷心希望前赴後繼的勇士們一點一點啃下這個硬骨頭。奧利給！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

常識庫與常識推理

常識庫整理

Cyc

概述

資料

ConceptNet

概述

資料

Commonsense QA

ATOMIC

概述

Social IQA

SQuAD

Cosmos QA

COMET

WIQA

PIQA

AI2

關於常識推理的一點想法

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

梁寧讀《原則》後感的摘錄

excel文件轉json

Cosmos QA：Machine reading comprehension with contextual commonsense reasoning

值得學習的健康習慣

達摩院2020十大科技趨勢（摘錄）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結