當深度學習遇上圖: 圖神經網絡的興起!

當深度學習遇上圖,會碰撞出怎樣的火花呢?

本文就帶你來了解一下——近年來逆勢而上的一門技術:圖神經網絡

內容選自《圖神經網絡:基礎與前沿(全綵)》一書!

01什麼是圖

也許我們從來沒有意識到,我們正生活在一個充滿圖的世界。例如,我們最熟悉的社交網絡(如下圖所示),就是一個最典型的圖。

在計算機領域,我們通常用圖指代一種廣義的抽象結構,用來表示一堆實體和它們之間的關係。實體被叫作圖的節點,而實體和實體之間的關係構成了圖的邊。嚴格來說,一個圖 G = {V, E} 包含一個節點集合V 和一個邊的集合E。

以社交網絡爲例,用戶可以作爲節點,而用戶和用戶之間的朋友關係可以作爲。事實上,作爲表示實體關係和結構化數據的一種方式,圖幾乎無處不在。

當我們在網上購物時,用戶和產品之間的購買關係可以形成用戶-產品圖。
當我們在公司工作時,有公司的組織結構圖。
當我們與同事或朋友發郵件、發微博交流時,則會產生交流圖。

除此之外,在人工智能的研究和應用產品中,圖結構的數據也佔據了非常重要的地位。

在自然語言處理中常用的知識圖譜,是用來表示領域知識、促進知識推理不可或缺的載體。
用於生物研究的蛋白質網絡,能夠表示蛋白質之間的相互作用。
在化學中,如果我們把原子看成節點,將原子間的化學鍵看成邊,那麼所有分子都是天然的圖結構。
物聯網傳感器之間需要連接成圖,共同獲取監測狀態。
互聯網中的鏈接關係讓所有網頁形成鏈接圖。
論文中的引用關係讓所有論文形成引文圖。
金融交易讓交易雙方形成交易圖。

此類例子不勝枚舉。

甚至在很多原本沒有明顯圖的數據上,人們也發現可以利用圖結構獲得新的突破。

一個典型的例子是文本摘要中利用句子之間的相似性構建的圖,對早期文檔摘要領域做出了巨大的貢獻。

在定理證明中,邏輯表達式可以表示成由變量和操作構成的圖。

同樣地,程序也可以表示成由變量構成的圖,用來判斷正確性;在多智能體(Multi-agent)系統中,agent 之間的隱性交互也被當作圖來處理。

02深度學習與圖

毫無疑問,深度學習正在成爲人類實現人工智能最重要的工具。

在當前時代,在大量數據和超強計算資源的推動下,深度學習強大的表徵能力使其在各個應用領域(自然語言處理、計算機視覺、計算機語音等)有了突破性的進展。

時至今日,在人工智能各種任務的排行榜上,我們已經很難找到非深度學習的最優模型了。

然而,大部分傳統深度學習模型,如卷積神經網絡(Convolutional Neural Networks,CNN)、循環神經網絡(Recurrent Neural Networks,RNN)等, 處理的數據都限定在歐幾里得空間,如二維的網格數據—圖像和一維的序列數據—文本,因爲它們的模型設計正得益於歐幾里得空間中這些數據的一些性質:例如,平移不變性和局部可聯通性。圖數據不像圖像和文本一樣具有規則的歐幾里得空間結構,因此這些模型無法直接應用到圖數據上。

圖數據的特殊性質

以卷積神經網絡爲例,我們通過對比網格數據和圖數據(如下圖所示)來說明爲什麼它不能直接用在圖上。

1. 節點的不均勻分佈

在網格數據中,每個節點(不包含邊緣節點)只有 4 個鄰接點,因此我們可以很方便地在一個網格數據的每個小區域中定義均勻的卷積操作。而在圖結構中,節點的度數可以任意變化,每個鄰域中的節點數都可能不一樣,我們沒有辦法直接把卷積操作複製到圖上。

2. 排列不變性

當我們任意變換兩個節點在圖結構中的空間位置時,整個圖的結構是不變的。如果用鄰接矩陣表示圖,調換鄰接矩陣的兩行,則圖的最終表示應該是不變的。在網格中,例如在圖像上,如果我們變換兩行像素,則圖像的結構會明顯變化。因此,我們沒有辦法像處理圖像一樣直接用卷積神經網絡處理圖的鄰接矩陣,因爲這樣得到的表示不具有排列不變性。

3. 邊的額外屬性

大部分圖結構上的邊並非只能取值二元的 {0,1},因爲實體和實體的關係不僅僅是有和沒有,在很多情況下,我們希望瞭解這些實體關係連接的強度或者類型。強度對應到邊的權重,而類型則對應到邊的屬性。顯然,在網格中,邊是沒有任何屬性和權重的,而卷積神經網絡也沒有可以處理邊的屬性的機制。

將深度學習擴展到圖上的挑戰

由於圖結構的普遍性,將深度學習擴展到圖結構上的研究得到了越來越多的關注,圖神經網絡(Graph Neural Networks,GNN)的模型應運而生。總體來說,深度學習在圖上的應用有以下幾個難點。

1. 圖數據的不規則性

正如前面所講,相對於網格數據,圖結構數據的不規則性使得傳統的卷積神經網絡不能直接應用在圖上,因此,在圖上,我們必須發展新的深度學習模型。

2. 圖結構的多樣性

作爲表示實體關係的數據類型,圖結構具有豐富的變體。圖可以是無向的,也可以是有向的;可以是無權重的,也可以是有權重的;除了同質圖,還有異構圖;等等。

3. 圖數據的大規模性

大數據作爲深度學習的“燃料”,在各個應用領域發揮了重要的作用。在大數據時代,我們同樣面臨大規模的圖的處理難題。我們常用的圖結構數據,如互聯網、社交網絡、金融交易網絡,動輒有數以億計的節點和邊,這對深度學習模型的效率提出了很高的要求。

4. 圖研究的跨領域性

我們介紹了各種各樣的圖,很容易發現圖的研究是橫跨很多不同的領域的,而在很多任務上,研究圖的性質都需要具有領域知識。例如,對分子圖的性質進行預測,我們需要具有一些化學知識;對邏輯表達式的圖進行處理,我們需要具有一些邏輯學知識。在《圖神經網絡:基礎與前沿》這本書中,我們將繼續探討圖神經網絡如何解決這些問題。

▊《圖神經網絡:基礎與前沿》

馬騰飛 編著

  • 梳理圖神經網絡(GNN)領域的經典模型

  • 幫助讀者構建圖神經網絡知識體系

  • 釐清重要模型的設計思路和技術細節

  • 展現圖神經網絡的研究進展

  • 圖神經網絡在推薦系統、生物醫療、自然語言處理等不同場景的實踐

圖神經網絡是人工智能領域的一個新興方向,它不僅迅速得到了學術界的廣泛關注,而且被成功地應用在工業界的多個領域。

本書介紹了圖神經網絡和圖深度學習的基礎知識和前沿研究,不僅包括它們的發展歷史和經典模型,還包括圖神經網絡在深層網絡、無監督學習、大規模訓練、知識圖譜推理等方面的前沿研究,以及它們在不同領域(如推薦系統、生化醫療、自然語言處理等)的實際應用。

本書既可作爲人工智能領域研究和開發人員的技術參考書,也可作爲對圖上的深度學習感興趣的高年級本科生和研究生的入門書。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章