1 摘要

本文基於層級的注意力機制(hierarchical attention)提出異質的GNN模型HAN(Heterogeneous graph Attention Network)。

包括節點級別(node-level)的注意力和語義級別(semantic-level)的注意力。

節點級別的注意力是學習節點和其基於元路徑的鄰居之間的重要性，語義級別的注意力是學習不同元路徑的重要性。

在3個真實數據集上實驗效果超過state-of-the-art，並且注意力機制有很好的可解釋性。

2 引言

GAT是使用了注意力機制的GNN，但只能用於同質圖，不能用於異質圖。本文設計了使用注意力機制並且能用於異質圖的HAN模型，需要解決以下幾個需求：

（1）圖的異質性

不同類型的節點特性不同，它們的特徵要映射到不同的特徵空間。如何處理複雜的結構信息並且保留多樣的特徵信息是亟待解決的問題。

（2）語義級別的attention

異質圖中不同的元路徑顯示了不同的語義信息，如何選擇最有意義的元路徑並且混合這些不同的語義信息是個問題。語義級別的attention就是爲不同元路徑衡量重要程度，分配不同的注意力。

（3）節點級別的attention

給定一種元路徑，每個節點都有多個基於該元路徑的鄰居，如何區別這些鄰居的不同之處，選擇信息量最豐富的的鄰居是個問題。節點級別的attention就是衡量這些鄰居的重要程度，爲其分配不同的注意力。

作者提出

作者提出HAN模型解決上述問題，步驟如下：

（1）將節點特徵作爲輸入，使用特定類別的轉換矩陣將不同類別的節點特徵映射到同一空間中。

（2）使用節點級別的attention爲特定元路徑下的節點鄰居分配注意力。

（3）使用語義級別的attention爲不同元路徑分配注意力。

（4）學習到上述兩個注意力係數後，以分層的方式得到鄰居和多條元路徑信息的最優組合，使得學習到的節點嵌入能更好地捕捉異質圖中的結構信息和豐富的語義信息。最後整個模型使用反向傳播優化。

本文的貢獻

是第一個基於attentino機制研究異質GNN的工作
提出HAN模型，結合了節點級別的attention和語義級別的attention，實現了同時考慮接地那和元路徑的重要性。模型高效，複雜度是線性的，和基於元路徑的節點對的數量成正比，可擴展到大規模的異質圖。
實驗證明了模型有效性，超越state-of-the-art，並且模型有很好的可解釋性。

3 定義

異質圖、元路徑以及基於元路徑的鄰居的定義不再贅述。要注意的是，節點 $i$ 的基於元路徑 $\Phi$ 的鄰居 $N^{\Phi}_i$ 包括 $i$ 節點自身。圖1是IMDB數據集組成的異質圖例子。

一些符號的定義如下：

4 HAN模型

首先提出節點級別的attention以學習到基於元路徑的不同鄰居的權重，然後將它們聚合得到語義級別的節點嵌入。之後HAN通過語義級別的attentino區別出不同的元路徑，得到針對特定任務的特定語義下節點嵌入的最優加權組合。

HAN模型的整體架構如圖2所示。

4.1 節點級別的attention

（1）由於節點的異質性，不同類型的節點有不同的特徵空間。要將不同類型節點的特徵通過轉化矩陣，映射到同一特徵空間才能進行後續處理。其中，每種類型的節點對應的轉換矩陣 $M_{\phi_i}$ 也是不同的。轉換矩陣只基於節點類型不針對於邊類型。映射過程如下所示， $h_i, h_{i^{'}}$ 分別是節點 $i$ 的原始特徵和轉換後的特徵。