(Always to be continued…)
因爲作者剛剛開始,很多不懂的基礎概念需要理解,未來也必將遇到更多的概念,自己也會不斷更新。當然,文中如果有不妥的地方,希望讀者能提醒校正,共同學習,萬分感謝。
實體對齊
指解決不同名稱指代同一個物體的過程,即 萬達董事長 和 王健林 是指代的同一個人,這兩個代詞要對齊。
實體消歧
指同樣的名稱可能指代多個物體,即說蘋果時 可能是 喫的蘋果,也可能是蘋果公司。
關係抽取(relation)
entity 和 entity之間的邊,即實體與實體之間的聯繫,比如姚明是人,姚明和人是實體。
屬性抽取(property)
指實體的固有屬性邊,比如顏色等固有屬性。
概念抽取
所謂概念,是指對一個entity的上位詞類型的抽取,比如說,劉德華是歌手,也是演員,歌手和演員都是作爲類別的一種,相對於劉德華這個具體事例,他們倆就是概念。
知識融合
將多個圖譜進行融合
知識推理
由於語料缺失而不能得到的關係,通過算法來彌補推理進而添加這些缺失的關係,稱之爲知識推理。
本體(ontology)
一種抽象概念,是一系列規則的集合,符合這些規則的東西都可以被劃歸爲一個類屬。
Reference:關於什麼是ontology可以參考這篇文章。
那麼其實這個看起來和KG中的概念分類(taxonomy)相似。
分類(taxonomy)
一種嚴格的層級式的分類方式,不同類種可以按照概念嚴格區分,比如可以生物學對動物的分類,是一個層級式的,每種動物都可以對應到唯一的具體類種。
taxonomy & ontology 區分
簡單點可以這樣理解二者區別:
taxonomy is usually only a hierarchy of concepts (i.e. the only relation between the concepts is parent/child, or subClass/superClass, or broader/narrower)
in an ontology, arbitrary complex relations between concepts can be expressed too (X marriedTo Y; or A worksFor B; or C locatedIn D, etc )
Reference:關於二者的區別可以參考這篇文章 。