提高複雜網絡分析效率！中國科學家研發強化學習新框架

近日，中國國防科技大學、美國加州大學洛杉磯分校和哈佛醫學院的研究人員研發了一個深度強化學習框架FINDER。相比於現有的解決方案，FINDER能夠更快速、更高效地找到複雜網絡中一組最關鍵的節點，進而使複雜網絡以較高的效率運行。

作者：董溫淑來源：智東西|2020-06-30 09:54

這項研究發表在國際期刊《自然》旗下的《自然–機器智能》上，論文標題爲《用深度強化學習找到複雜網絡的關鍵參與者（Finding key players in complex networks through deep reinforcement learning）》。

論文鏈接：
https://www.nature.com/articles/s42256-020-0177-2

一、FINDER：適用場景更廣泛，運行速度快出幾個數量級

在物理科學、信息科學、生物科學等領域的研究中，研究人員可以通過建立網絡拓撲結構來模擬實際情況、進而作出預測。

在這類複雜網絡的運行過程中，節點間的配合直接決定了複雜網絡運行的效率。當被用於解決NP難題（NP-hard）時，複雜網絡中節點的“分工協作”尤其重要。

NP難題指的是在多項式時間內可以被驗證其正確性的問題。比如，在疫情防控領域，複雜網絡模型可以模擬出疫情傳播情況、幫助找到疫苗藥物分子等。運行這些任務時，複雜網絡要推演和驗證病毒是否會傳染給下一個人、某種藥物分子是否有效的各種情況。在這個過程中，找到最關鍵的節點能夠提升複雜網絡的運行效率。

對於這類問題，現有的解決方案通常基於大型網絡進行訓練、針對特定場景提出策略，但缺乏統一的框架。相比之下，中國國防科技大學、加州大學洛杉磯分校、哈佛醫學院的研究人員提出的FINDER可以應用於廣泛的複雜網絡場景，其運行速度快了幾個數量級。

二、分兩階段進行訓練，分別採用不同獎勵函數

FINDER框架採用純數據驅動的方法，分兩個階段進行訓練。在兩個階段中，研究人員用不同的獎勵函數來訓練FINDER。

第一階段用經典模型生成的小型合成網絡對FINDER進行離線訓練。離線訓練採用ϵ-greedy策略。

離線訓練階段分三步進行：首先，研究人員生成一批合成圖形；然後，研究人員從合成圖形中任意取樣一個圖形；接下來，FINDER框架在這一圖形上進行整個尋找關鍵節點的流程。這一流程中，代理與圖形通過一系列狀態、動作、激勵進行交互。

爲了確定狀態的正確動作，代理先在當前的圖形上編碼，並獲取每個節點的嵌入向量。節點的嵌入向量會捕獲節點的結構信息和節點特徵之間的長程相互作用（long-range interaction）。接下來，代理將嵌入向量解碼爲標量Q值，以便所有節點能夠預測部署某個動作的長程增益。

▲離線訓練階段示意圖

一旦離線訓練結束，FINDER就進入第二個訓練階段，被應用於真實網絡拓撲結構中。研究人員在浣熊接觸網絡（the raccoon contact network）的最大連通元件（connected component）上進行測試。最大連通元件包括14個節點和20條邊。

這一階段中，代理首先將當前網絡編碼爲低維嵌入向量，然後利用這些向量對每個節點的Q值進行解碼。

第二階段採用“批量節點選擇（batch nodes selection）”策略。該策略在每個自適應步驟中選擇一個有限分數的最高Q節點，避免了對嵌入向量和Q值的逐個迭代選擇和重新計算。批量節點選擇策略不會影響最終的結果，但可以降低幾個數量級的時間複雜度。

研究人員會重複這個過程，直到複雜網絡達到用戶定義的終端狀態、被移除的節點構成最優的節點集合。

▲用真實複雜網絡進行訓練示意圖

三、對比3個模型性能，FINDER找出關鍵節點的效率最高

相比於機器人等傳統的強化學習技術（狀態和動作較爲簡單），複雜網絡技術更加複雜和難以表示。研究團隊高級研究員孫怡舟稱，這是因爲複雜網絡具有離散的數據結構和處於極其高維的空間。

本項研究中，研究人員用圖神經網絡（GNN）來解決這個問題。圖神經網絡中的節點代表動作、圖形代表狀態。

以911恐怖襲擊事件發生預測網絡爲例，網絡中每個節點代表參與911恐襲的恐怖分子、每個邊（edge）代表他們的社會交流。

研究人員在911恐怖襲擊事件發生預測網絡上運行FINDER框架，並運行現有的高維（HD）方法和集體影響（CI）方法做對比。

下圖d顯示了三種方法的ANC曲線。在框架部署動作後，剩餘節點的重要性越低，代表框架性能越好。

可以看到，FINDER框架最有效地找到了複雜網絡中關鍵節點。相比於其他兩個解決方案，隨着被移除節點的重要性升高，運行FINDER框架的複雜網絡中剩餘的節點重要性最低。

▲911恐怖襲擊事件發生預測網絡（藍色點代表剩餘圖形中的節點，紅色點代表當前時間步長中FINDER找出的關鍵節點，灰色點代表剩餘的孤立節點）

結語：未來將可用於更多類型複雜網絡

FINDER框架通過深度強化學習方法進行訓練，可以找到複雜網絡中的關鍵節點。在未來，FINDER框架或可被用於優化社交網絡、電力網絡、傳染病蔓延網絡等模型的性能。

目前，加州大學洛杉磯分校的研究團隊正計劃將FINDER框架用於網絡科學研究。哈佛醫學院的團隊希望將FINDER用於生物網絡，以確定蛋白質交互網絡和基因調控網絡中的關鍵參與者。

另外，研究人員稱未來將從以下三方面着手，提升框架尋找關鍵節點的性能：設計出更好的圖形表示學習架構；探索如何在跨圖形甚至跨域轉移知識；研究並解決複雜網絡上的其他NP難題。

【編輯推薦】

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

提高複雜網絡分析效率！中國科學家研發強化學習新框架