Apache HugeGraph1.0.0 版本正式發佈!

摘要:百度安全助力國產數據庫走向國際,與用戶開發者共成長

日前, Apache HugeGraph (incubating) 第一個 Apache Release 版本 1.0.0 目前已正式發佈,基於過去的一年時間裏社區的同學開發了許多實用的新功能,重構多個項目模塊並對 ASF 規範進行了全方面的適配和改造,在基金會導師指導下處理了 ASF 開源項目合規性等問題後,此次新版本由 30+ 位 Contributors 貢獻了超過 270 個 Pull Request,於 2023 年初開始進行首輪 Apache 孵化發版投票,最後經過兩輪調整於 2023 年 3 月正式發佈。

 

根據DB-Engines數據顯示,自2021年初起開源數據庫的全球部署首次超過商業數據庫,在於單純依靠個別技術或軟件很難構建成熟、完善的產品,而依賴社區生態推進往往能打磨出出色的數據庫產品。並且開源數據庫存在成本優勢、產品豐富度、社區活躍性等方面的優越性,成爲驅動數據庫技術和市場變革的重要力量,也是構建國產自研數據庫生態、加速技術迭代、讓國產數據庫走向國際化的重要途徑,得以聚焦安全可控,通過構建數字技術創新體系和數字安全屏障,來爲數字中國的發展提供安全可控的底座,實現科技自立自強。

 

HugeGraph是百度安全於2017年自主研發的國內首個開源圖數據庫,提供了一站式的千億級大規模圖數據的存儲、在線查詢、離線分析能力,廣泛應用於社交網絡、廣告推薦、網絡安全、金融風控、智能機器人等場景。HugeGraph 於2018年開源,2022年1月正式通過世界頂級開源組織 Apache 軟件基金會的投票決議,以全票通過的優秀表現正式成爲全球首個加入Apache 孵化的圖數據庫項目,同年5月正式入駐Apache開啓孵化,促使國產圖數據庫走向世界,在提升圖數據庫產品開發效率、降低產業應用成本的同時,在人才、生態建設產生深遠的影響,讓更多開發者因此受益。Apache HugeGraph 在百度衆多業務中發揮了重要的作用,尤其是在反黑產、團伙發現等安全風控領域效果顯著,也成爲衆多百度合作伙伴的優質之選。截止發版時, HugeGraph 在 GitHub 上具有 2200+ Stars,項目總 Contributors 數量超過 80 名,社區版本下載量超過 2 萬,並有超過 100 個社區用戶、組織在使用,包括網商銀行、網易遊戲、360安全、滴滴、科大訊飛、虎牙直播、CVTE、貨拉拉等,並且以上公司也在與HugeGraph 一道共建開源社區。

 

Apache HugeGraph 1.0.0 版本在性能和實用性、易用性上做了大量改進和修復,包含 25000+ 行 Pull Request 代碼變更提交:在系統語言上,圖數據庫與圖計算等組件均升級適配 Java 11,已覆蓋所有子項目 , 並新增支持 Cypher 圖查詢語言,目前已同時支持 Gremlin 與 Cypher 兩大主流圖查詢語言;在服務器上支持更多內置圖算法,包括16 個 OLAP 算法包括:LPA、 Louvain、 PageRank、 Betweenness / Closeness / Eigencentrality Centrality、 RingsDetect 等,2 個 OLTP 算法,包括:adamic-adar 和 resource-allocation; 在大規模並行圖計算框架 (Computer)上,支持海量圖數據的MPP計算,尤其是擴散性/中心性等空間消耗大的算法,支持 K8s Standalone (單機)模式,預留 Yarn 接口可實現直接對接;在大數據組件支持上, 新增支持 Flink CDC 數據流式與同步導入、 Spark 批量導入數據、支持 Bypass Server 模式,大幅提高了圖數據庫的在線/離線場景下的導入/導出/圖遷移性能和方便性;並在易用性上,提供一鍵 Server/Hubble 容器化 Docker 支持,重構整合圖周邊工具鏈爲 HugeGraph Toolchain等120 多項細節版本更新。此外,在 2022 年HugeGraph 相繼完成了信創廠商飛騰、麒麟、海光等的兼容性認證,併入選了年度 “科創中國” 十大開源創新項目榜單。

 

HugeGraph 不僅是國內第一個開源的圖數據庫產品,也是唯一捐贈給 ASF的圖系統。它實現了 Apache TinkerPop3 框架兼容 Gremlin + Cypher 查詢語言, 具備完善的工具鏈組件,助力用戶輕鬆構建基於圖數據庫之上的應用和產品。HugeGraph 支持百億以上的頂點和邊快速導入,並提供毫秒級的關聯關係查詢能力(OLTP), 還可與 Hadoop、Spark 等大數據平臺集成以進行數據集成,提供自研的圖計算系統,形成整合的一站式圖服務。圖數據庫能夠支撐新型應用場景的關聯分析業務,根據 Gartner 預測,到 2025 年圖技術將應用於 80% 的數據和分析創新,而圖技術是圖數據庫的核心技術。

 

百度不僅參與開源生態,也秉承開源開放姿態積極建設開源生態,貢獻了大量的開源項目,如中國首個自主研發開源開放的產業級深度學習平臺飛槳、自動駕駛平臺 Apollo、可視化渲染庫 Apache ECharts、數據倉庫 Apache Doris 等。一方面是因爲百度的技術基因,另一方面也是表達一種開放的態度。百度深深理解在技術領域一枝獨秀不是春,只有擁抱開源,很多技術和產品才能加速發展、拓寬邊界,實現與廣大用戶及開發者共同成長,打造繁榮的開源生態。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章