知識圖譜完整項目實戰(附源碼)(3)

一、前言

本文是《知識圖譜完整項目實戰(附源碼)》系列博文的第3篇:汽車知識圖譜系統架構設計,主要介紹汽車領域知識圖譜系統的總體架構設計和關鍵技術。

知識圖譜的學習是一個基礎到實戰,從入門到精通的一個逐漸深入的、漸進式的過程。在這個過程中,一個完整的項目,起到的作用往往是對過往所學全部知識的串聯和融合。只有經過一個完整項目的實踐,才能真正把所學的、離散的、點狀的知識點融合到一起,從而形成理論到實戰的轉變。基於這樣的一個原因考慮,結合自身工程實踐的過程,纔有了這樣一個課程,希望能夠對渴望知識圖譜能力進階的人有所裨益。

二、正文

2.1 汽車知識圖譜總體設計

汽車知識圖譜的系統架構可以劃分爲五個層次:數據源、ETL知識抽取層、數據模型層、業務邏輯層、知識應用層。這裏面層次的劃分其實是在參考傳統的數據系統建設的思路。

2.2 汽車知識圖譜關鍵技術

知識圖譜的關鍵技術可以從知識的來源進行區分,包括知識獲取對應網絡爬蟲,ETL工具;知識存儲對應圖數據庫;知識圖譜可視化對應數據可視化分析工具等。

2.2.1 圖數據庫

Neo4j是圖數據庫領域的王者,連續多年在DB排行中處於第一,具有成熟的文檔和穩定的系統,同時包括開源版本和企業版本,是構建知識圖譜的首選。

Apache Jena是RDF和OWL的開發框架,同時提供了Fusike和TDB的數據訪問和存儲支持,是基於本體建模的最佳選擇。

2.2.2 Python爬蟲


python爬蟲框架中,最爲成熟和完整的框架是scrapy,目前爲止是基於pyton構建網絡爬蟲的最佳選擇。其工作流程和運行機制如下圖所示:

三、未完待續

本文是《知識圖譜完整項目實戰(附源碼)》系列博文的第3篇:汽車知識圖譜系統架構設計,主要介紹汽車領域知識圖譜系統的總體架構設計和關鍵技術。知識圖譜交流羣:149933712。

上一篇:

《知識圖譜完整項目實戰(附源碼)(2)》:知識圖譜完整項目案例演示;

《知識圖譜完整項目實戰(附源碼)(1)》:汽車知識圖譜概述;


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章