本體和知識圖譜之間的區別是什麼?

導語:換句話說:本體+數據=知識圖譜
譯者:AI研習社(洛克•麥金託小海綿

雙語原文鏈接:What’s the Difference Between an Ontology and a Knowledge Graph?


隨着語義應用程序成爲業界越來越熱門的話題,客戶經常來EK詢問有關本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什麼關係?

在這篇博客中,我將引導您瞭解本體和知識知識圖譜,講述它們之間的區別以及它們如何組織大量數據和信息。

什麼是本體?

本體是語義數據模型,用於定義domain中事物的類型以及可用於描述它們的屬性。本體是廣義的數據模型,這意味着它們僅對具有某些屬性的事物的一般類型進行建模,而並不包含有關我們domain中具體個體的信息。例如,本體論不能描述您的狗,斑點和它的所有個體特徵,主要描述狗的一般概念,嘗試描述大多數狗可能具有的特徵。這樣做可以使我們在將來用本體來描述其他狗。

本體有三個主要組成部分,通常描述如下:

  • 類: 存在於數據中的不同類型的。

  • 關係:連接兩個類的屬性。

  • 屬性:描述單個類的屬性。

例如,假設我們有以下關於書籍、作者和出版商的信息:

首先,我們要標識類(數據中事物的唯一類型)。這個示例數據似乎捕獲了關於書籍的信息,因此它是類的一個很好的候選項。具體來說,示例數據捕獲了關於書籍的某些類型的內容,比如作家和出版商。再深入一點,我們可以看到我們的數據還捕獲了關於出版商和作者的信息,比如他們的位置。這給我們留下了這個例子中的四個類:

  • 書籍

  • 作者

  • 出版商

  • 位置

下一步,我們需要標識關係和屬性(爲了簡單,我們可以將關係和實體屬性都視爲屬性)。使用我們在之前定義的類,我們可以查看數據並開始列出我們看到的每個類的所有屬性。例如,在書籍類中,一些屬性可能是:

  • 書籍有作者

  • 書籍有出版商

  • 書集是在一個日期出版的

  • 書籍之後有續集(其他書)

其中一些屬性是連接兩個類的關係。例如,關係屬性“書籍有作者”是一個連接書籍類和作者類的關係。其他屬性,像“書籍發佈的日期”是實體屬性,只描述一個類,而不是將兩個類連接在一起。

需要注意的是,這些屬性可能適用於任何給定的書籍,但它們不一定適用於每一本書。例如,很多書都沒有續集。這在我們的本體中很好,因爲我們只是想確保我們捕獲了可能適用於許多(但不一定是所有)書籍的屬性。

雖然上面的屬性列表很容易閱讀,但是重寫這些屬性以更清楚地定義我們的類和屬性會有所幫助。例如,“書籍有作者”可以寫成:

書→有作者→作者

儘管你可以包括更多的屬性,這取決於你的用例,對於這個博客,我已經定義了以下屬性:

  • 書→有作者→作者

  • 書→有出版商→出版商

  • 書→出版於→出版日期

  • 書→後面是→書

  • 出版商 →位於→位置

  • 位置→位於→位置

記住,我們的本體是一個通用的數據模型,這意味着我們不想在本體中包含關於特定書籍的信息。相反,我們希望創建一個可重用的框架,將來我們可以用它來描述其他書籍。

當我們結合類和關係時,我們能夠以圖的形式查看本體:

什麼是知識圖譜?

使用本體作爲一個框架,我們可以添加關於個別書籍、作者、出版商和位置的真實數據來創建一個知識圖譜。利用上面表中的信息和本體,我們可以創建每個本體關係的特定實例。比如,如果我們的本體中有這樣的關係“書籍→有作者→作者”,這個關係的單個實例如下:

如果我們把我們擁有的關於《殺死一隻知更鳥》這本書的所有信息加進去,我們可以看到知識圖譜的開端:

如果我們對所有的數據都這麼做,我們最終會得到一個使用本體對數據進行編碼的圖。通過使用知識圖譜,我們可以將數據看作一個關係網絡,而不是作爲單獨的表格在我們無法理解的數據點間繪製新的連接。具體來說,使用SPARQL,我們可以查詢數據和使用推理功能(讓知識圖譜建立之前沒有定義的連接)。

那麼本體和知識圖譜有什麼不同呢?

正如你在上面例子中所看的,當你將本體(我們的數據模型)應用到一組單獨的數據點(書籍、作者和出版商數據)時,那麼就是創建了一個知識圖譜。換句話說:

本體+數據=知識圖譜


AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,爲AI學術青年和開發者的交流互助和職業發展打造一站式平臺,致力成爲中國最大的科技創新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章