一、知識圖譜搭建流程
問題定義-》數據收集-》數據預處理-》設計知識圖譜-》存儲知識圖譜-》應用知識圖譜-》評估系統
二、知識圖譜設計原則
1)需要哪些實體、關係、屬性?
2)哪些屬性可以作爲實體,哪些實體可以作爲屬性?
3)那些信息不需要放在知識圖譜?
三、業務原則(Business Principle)
一切要從業務的邏輯出發,通過觀察知識圖譜的設計也很容易推測背後業務的邏輯。而且設計時也要想好未來業務的變化
以人爲中心
四、分析原則 (Analytic Principle)
知識圖譜任何一個實體都是爲關係分析而服務,如果一個實體對分析網絡結構沒有幫助,則可以設置成屬性甚至不要放在知識圖譜裏
電話作爲知識圖譜中最重要的實體之一,電話作爲實體,可以構成有效的電話網絡。名字作爲屬性放到實體裏面。
五、冗餘原則
知識圖譜中經常存在一些節點和大部分的節點存在鏈接關係。其實這些節點的意義不大,同時也會急劇降低系統的查詢效率。重複信息也需要避免存儲。
六、效率原則
知識圖譜儘量輕便,存關鍵的信息,剩下的可以存儲在傳統的數據庫中。