藉助ArangoDB，帶你玩轉Google圖算法引擎Pregel

原創

2019-07-18 03:57

藉助ArangoDB，帶你玩轉Google圖算法引擎Pregel

ArangoDB團隊研究出一種算法，能夠在一個圖中識別出已連接的子圖，文中以國家爲例；在ArangoDB中引入Pregel框架，通過Worker算法、合成算法、pregelRunner模塊來執行不同的實現方式。來試試吧！

ArangoDB團隊研究出一種算法，能夠在一個圖中識別出已連接的子圖，文中以國家爲例；在ArangoDB中引入Pregel框架，通過Worker算法、合成算法、pregelRunner模塊來執行不同的實現方式。開發者也可以自行編寫算法，編程世界魅力無窮！

譯文如下：

Pregel作爲Google推出的一種面向圖算法的分佈式編程框架，主要用於處理大規模的圖算法計算。比如，圖遍歷（BFS）、最短路徑（SSSP）、PageRank計算等。

檢測“已連接節點”的算法

爲了解決已連接節點的問題，ArangoDB團隊研究出一種算法，能夠在一個圖中識別出已連接的子圖。這裏以國家爲例子，下圖包含10個國家，互相之間的關係定義爲邊界接壤(hasBorderWith)，其形成的4種已連接節點組分別爲：

德國，奧地利，瑞士
摩洛哥，阿爾及利亞，突尼斯
巴西，阿根廷，烏拉圭
澳大利亞

要導入該圖，請點擊這裏進行下載，然後打開ArangoShell並執行如下語句：

Worker算法

Worker算法執行於圖中每個頂點之上，每個頂點有一個相關的消息遊標和一個global對象，裏面含有步長信息和用戶定義的Global數據。該算法定義如下：

爲了檢測所有的節點組，這裏使用了一種非常直接的方法：

每個節點組有一個字母標識符，存有其頂點最後的_key屬性信息。所以，第0步的時候，每個頂點存儲的是其自身的key信息以及初始鄰近接壤節點信息。要訪問源頂點需要使用_get(“someAttribute”)方法：

一個頂點只能訪問其外部邊界，因此在第1步的時候要記得把它所有接收到的消息放入數組中，以便進行向後通信，同時要根據傳入的消息來更新節點組。

所以前兩步的操作開啓了向前和向後通信，接着執行算法直到每個頂貼都接收到其頂點組標識信息。因此，當接收到鄰近標識符信息後，每個頂點需要更新頂點組標識信息：

當一個頂點不再接收到新的消息或新的組標識時，要使它暫時失效。僅當再從鄰近頂點接收新消息的時候進行激活：

如果接收到新的組標識時要把結果進行存儲：

接着要通知鄰近頂點，包括向前與向後：

然後失效該頂點直到接收到新的消息：

合成算法

爲了減少冗餘的消息使得工作者算法更加高效，ArangoDB團隊引入了消息合成算法。比方說在該示例中，德國節點可能會收到來自奧地利和瑞士的消息；由於按字母排序，奧地利的消息可以忽略，從而減少不必要的消息接收。在Pregel中的消息合成器可定義爲：

合成器會篩選冗餘消息，然後發送有效的標識信息：

引入該算法後，德國節點雖然有兩個接壤點，但是隻會收到一個消息。

pregelRunner模塊

首先創建Runner實例：

Pregel算法的具體實現請點擊這裏進行下載。在Shell中載入該文件，使Runner可以實現相關函數：

然後在圖中啓動Pregel：

啓動後會接收到唯一的執行碼，可以使用runner來查閱當前運行狀態：

執行完畢後可以得到圖的結果名：

要檢查該結果是否符合要求，可以載入全部頂點進行校對：

結果是正確的，算法能正確識別出4個子圖(瑞士，突尼斯，烏拉圭，澳大利亞)。最後要做好收尾工作：

寫在最後：

ArangoDB仍在進一步完善pregelRunner以滿足更大規模圖處理的需求。很多受時間和內存限制的大型圖問題在Pregel系統中都可逐步解決，例如：最短路徑，圖着色，最小生成樹等。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

美團面試：說說Netty的零拷貝技術？

零拷貝技術（Zero-Copy）是一個大家耳熟能詳的技術名詞了，它主要用於提升 IO（Input & Output）的傳輸性能。那麼問題來了，爲什麼零拷貝技術能提升 IO 性能？ 1.零拷貝技術和性能在傳統的 IO 操作中，當我們需要讀

Java中文社羣

2024-06-07 14:39:30

2024 Web 新特性 - 使用 Popover API 創建彈窗

Popover API 爲開發者提供了一種聲明式的方式來創建各種類型的彈窗。目前已在所有三大瀏覽器引擎中可用，並正式成爲 Baseline 2024 的一部分。一直以來，我們在實現彈出式菜單、提示框或信息卡片時，往往依賴於各種JavaSc

2024-06-07 14:33:29

開發視頻會議系統：使用GPU解碼渲染視頻

現在，使用視頻會議系統遠程協同辦公、溝通交流，已經非常普遍了。如果我們要開發自己的視頻會議系統，那麼，GPU解碼渲染技術是不可缺少的。在視頻會議系統中，經常需要同時觀看會議中多個參會人員的視頻圖像，另外，還可能需要

2024-06-07 14:33:09

C#/.NET/.NET Core優秀項目和框架2024年5月簡報

前言公衆號每月定期推廣和分享的C#/.NET/.NET Core優秀項目和框架（每週至少會推薦兩個優秀的項目和框架當然節假日除外），公衆號推文中有項目和框架的介紹、功能特點、使用方式以及部分功能截圖等（打不開或者打開GitHub很慢的同

2024-06-07 14:28:29

計劃做點事情-還是跳槽

【最近想做什麼了】和之前一樣，模板還是跳槽【爲什麼要做這個】和之前一樣，但是還是想再寫一遍現在的工作，錢少事多離家遠現在的自己，人窮有家要搞錢【要在什麼時間達到什麼樣的目標，分段計劃是怎樣的】目前可信考試是過了，太簡單了，算

2024-06-07 14:26:39

好久沒來了-20240607

【今天又是什麼日子】今天是2024年6月7日，星期五，其實也沒有很特別只不過剛好是今年高考的第一天，寫這個的時候上午的考試應該完了高考很重要，每一天都很重要年輕很好，每一天也很好且行且珍惜【上次來是什麼時候】上次來還是上個月月

2024-06-07 14:26:39

vscode win11 配置go

官網安裝後, vscode會自動識別. 右下角選go.(不能選go module) 然後安裝go插件.之後運行即可. 如果自動安裝delve啥的出錯. 就先自己配置. go env -w GOPROXY=https://goproxy.cn

張博的博客

2024-06-07 14:26:29

構建Arm版jdk1.8 docker基礎鏡像

前言 jdk1.8的docker鏡像默認是cpu架構爲x64的，在arm架構或者aarch64 上運行java應用需要自己構建一個對應cpu架構的jdk基礎鏡像過程首先去Oracle官網下載對應的Arm架構的1.8版本jdk 下載好後

2024-06-07 14:23:19

微軟RPA工具Power Automate Desktop

什麼是RPA RPA（機器人流程自動化）系統是一種應用程序，它通過模仿用戶在電腦上的操作方法, 實現自動化操作流程, 協助人在計算機、手機等計算設備中完成重複的工作流任務。 Power Automate Desktop 2021年3月2日

2024-06-07 14:20:58

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

2024-06-07 14:20:58

在線課䟫

https://www.edx.org/edxchina https://www.coursera.org/ https://www.xuetangx.com/search?query=%E9%83%91%E6%AF%93%E7%

2024-06-07 14:20:58

高分通過RPA高級認證

2024-06-07 14:20:58

k8s網絡問題以及容器跨宿主機通信原理 k8s組件和網絡插件掛掉，演示已有的pod是否正常運行 k8s組件和網絡插件掛掉，演示已有的pod是否正常運行

【0】資源配置文件 [root@mcwk8s03 mcwtest]# ls mcwdeploy.yaml [root@mcwk8s03 mcwtest]# cat mcwdeploy.yaml apiVersion: apps/v1 k

2024-06-07 14:19:58

dubbo~全局異常攔截器的使用與設計缺陷

異常攔截器ExceptionMapper 在JAX-RS（Java API for RESTful Web Services）中，ExceptionMapper接口用於將Java異常映射到HTTP響應。通過實現ExceptionMapper

2024-06-07 14:18:38

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

從最初的CS架構，如MFC Java Swing 等，到BS架構，JSP PHP，再到前端後端分離，前端從jquery GWT-Ext 到 Handlebars ，再到angularJS/Vue/React，反觀java 世界，學好 S

2024-06-07 14:14:28

24小時熱門文章

最新文章

最新評論文章