知識圖譜介紹

前言

看到這個名詞,首先抓到的是“圖”,知識圖譜的數據結構應該是圖。當時我就好奇知識圖譜是幹什麼的,於是這兩天查閱了一些資料,總結凝鍊寫成博文,供以後翻閱。

知識圖譜是什麼?

知識圖譜是一個圖結構,是一個知識網絡,知識圖譜旨在描述真實世界中存在的各種實體或概念,圖中節點代表實體,邊表示”關係”(relation)或者”屬性”(attribute)。每個屬性-值對(attribute-value pair,又稱AVP)用來刻畫實體的內在特性,而關係用來連接兩個實體,刻畫它們之間的關聯。可以舉例如下:
楊冪(實體1)–老公(屬性)–劉愷威(實體2)
當然,現實中用到的知識圖譜肯定不是這麼簡單,國際上流行的知識庫包含關係的數量級是億級,所以真實的知識圖譜可能是以下樣子:
這裏寫圖片描述

進一步理解知識圖譜,可以看一下它在搜索中的應用。打開百bing搜索姚明身高,得到以下結果:
這裏寫圖片描述

學過信息檢索,檢索返回結果原本是按相似度排序的網頁,類似與下列頁面(圖片來自網絡)
這裏寫圖片描述

對比可以看出知識圖譜爲搜索提供了一個更直觀的反饋。反饋給用戶一個知識卡片,卡片上直接展示了姚明的身高、簡介及更多相關信息。知識圖譜出現的背景是互聯網逐步從僅包含網頁與網頁之間超鏈接的文檔萬維網轉變爲包含大量描述各種實體和實體之間豐富關係的數據萬維網。對比傳統的搜索引擎和知識圖譜的變化有以下三點:
1.信息抽取目標發生了變化,傳統的文本指定抽取(ACE)=>海量數據的發現(KBP);
2.從文本分析爲核心轉變成了知識發現爲核心;
3.讓計算機真正理解用戶的查詢需求,給出準確答案而不是給出相關的鏈接序列;

知識圖譜構建過程

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章