KG中一些基本術語的理解

(Always to be continued…)

因爲作者剛剛開始,很多不懂的基礎概念需要理解,未來也必將遇到更多的概念,自己也會不斷更新。當然,文中如果有不妥的地方,希望讀者能提醒校正,共同學習,萬分感謝。

實體對齊

指解決不同名稱指代同一個物體的過程,即 萬達董事長 和 王健林 是指代的同一個人,這兩個代詞要對齊。

實體消歧

指同樣的名稱可能指代多個物體,即說蘋果時 可能是 喫的蘋果,也可能是蘋果公司。

關係抽取(relation)

entity 和 entity之間的邊,即實體與實體之間的聯繫,比如姚明是人,姚明和人是實體。

屬性抽取(property)

指實體的固有屬性邊,比如顏色等固有屬性。

概念抽取

所謂概念,是指對一個entity的上位詞類型的抽取,比如說,劉德華是歌手,也是演員,歌手和演員都是作爲類別的一種,相對於劉德華這個具體事例,他們倆就是概念。

知識融合

將多個圖譜進行融合

知識推理

由於語料缺失而不能得到的關係,通過算法來彌補推理進而添加這些缺失的關係,稱之爲知識推理。

本體(ontology)

一種抽象概念,是一系列規則的集合,符合這些規則的東西都可以被劃歸爲一個類屬。

Reference:關於什麼是ontology可以參考這篇文章

那麼其實這個看起來和KG中的概念分類(taxonomy)相似。

分類(taxonomy)

一種嚴格的層級式的分類方式,不同類種可以按照概念嚴格區分,比如可以生物學對動物的分類,是一個層級式的,每種動物都可以對應到唯一的具體類種。

taxonomy & ontology 區分

簡單點可以這樣理解二者區別:

taxonomy is usually only a hierarchy of concepts (i.e. the only relation between the concepts is parent/child, or subClass/superClass, or broader/narrower)

in an ontology, arbitrary complex relations between concepts can be expressed too (X marriedTo Y; or A worksFor B; or C locatedIn D, etc )

Reference:關於二者的區別可以參考這篇文章

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章