什麼是知識圖譜

什麼是知識圖譜,我們可以把它理解成一張由知識點相互連接而成的語義網絡。


圖1--什麼是知識圖譜

任何一種網絡都是由節點和節點關係構成。爲了直觀理解這個概念,拿小孩子玩的磁力棒舉例,節點是鋼珠,節點關係是磁力棒。


圖2 -- 節點和關係

很多的鋼珠(節點)和磁力棒(關係)相互關聯,就構成了一張網絡


圖3 -- 由節點和關係構成的網

在知識圖譜中,什麼是節點,什麼是節點關係?
如圖1所示,人物、作品、地點、數值、身高等都可以作爲知識圖譜中的節點,我們稱這些節點爲實體。

實體可以由若干個屬性表示,例如,人物這類實體有生日、身高、妻子等屬性。電影實體有導演、演員、製片國家、上映日期等。

通過實體屬性可以將不同的實體建立關聯關係,例如:
劉德華 (實體)-- 妻子(屬性) -> 朱麗倩(另一個實體)
劉德華 -- 電影作品 -> 無間道
無間道 -- 製片國家/地區 -> 中國香港

現在讀者應該對知識圖譜有了直觀的概念了。問題來了,爲啥要有這麼個東西?它產生的背景是什麼,是要解決啥問題?

從1990年底web誕生到現在,萬維網經過20多年的發展,現在對大家來說已經習以爲常了。萬維網也是一種網絡,構成萬維網的節點是一個個的網頁,網頁之間通過超鏈接建立關聯關係。拜萬維網這種簡單、開放的技術所賜,人類的信息獲取能力有了巨大的飛躍。在萬維網基礎上誕生了現代的搜索引擎技術,人們通過關鍵字就能快速的找到相關網頁,然後再從一堆網頁候選結果中找尋自己真正想要的答案。

隨着移動互聯網的發展,人們對搜索的期望更高了一階,爲什麼不給我更精確的答案?
移動手機的屏幕很小,沒有那麼多的空間展示那麼多的搜索結果,用戶也沒有耐心再一個個打開網頁,尋找答案;
另外,更多新的搜索形態諸如語音搜索、拍照搜索、人機對話等不斷產生並快速演化,用戶同樣希望搜索引擎能夠結合着自身喜好、地理位置、時間點等給出更精確的回答。


圖4--從萬維網到知識圖譜

要想更精準的滿足用戶需求,搜索引擎就不能只是存儲網頁文檔,而是要通過各種方式,能夠識別出網頁中出現的實體以及實體屬性,並將它們納入到知識圖譜中。當用戶發起搜索時,能夠根據知識圖譜已知的知識點,準確理解用戶意圖,並給出最精準的回答。


發佈了54 篇原創文章 · 獲贊 27 · 訪問量 19萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章