題目：ANRL: Attributed Network Representation Learning via Deep Neural Networks

作者：Zhen Zhang and Hongxia Yang and Jiajun Bu and Sheng Zhou and Pinggang Yu and Jianwei Zhang and Martin Ester and Can Wang

來源：IJCAI 2018

源碼：https://github.com/cszhangzhen/ANRL

傳統的基於網絡結構的網絡表示學習方法沒有利用屬性信息。結合拓撲結構和屬性的表示學習方法目前仍然屬於初步階段原因：

（1）網絡結構和節點屬性是兩種異構信息源，如何在同一個向量空間中保留他們的屬性是一個問題。

（2）觀察到的網絡數據通常不完整甚至有噪聲，難以得到有效的表示。

創新點

（1）自編碼器的用法：用屬性作爲輸入，重建的是並不是自身屬性，而是鄰居屬性的聚合（加權平均或中位數）。這樣聚合鄰居特徵有點類似GCN的做法，好處是聚合後的特徵能夠帶有本地拓撲信息。所以作爲中間層的表示也一定程度上考慮了本地結構信息。（但是這方面文中並沒有詳細解釋爲什麼好）

（2）屬性和拓撲的結合方式：用自編碼器的中間層作爲embedding；用embedding計算二階相似度來更新embedding。

模型

Neighbor Enhancement Autoencoder

輸入：節點 $v_i$ 的特徵 $x_i$

輸出：節點 $v_i$ 鄰居的特徵重建值，重建的目標 $T(v_i)$ 聚合了鄰居的特徵

自編碼器loss定義
$\mathcal{L}_{a e}=\sum_{i=1}^{n}\left\|\hat{\mathbf{x}}_{i}-T\left(v_{i}\right)\right\|_{2}^{2}{\tag 2}$
其中 $T(\cdot)$ 採取以下兩種方式：

Weighted Average Neighbor：

鄰居特徵的加權平均
$T\left(v_{i}\right)= \frac{1}{|\mathcal{N}(i)|} \sum_{j \in \mathcal{N}(i)} w_{i j} \mathbf{x}_{j}$
Elementwise Median Neighbor：

取每一維特徵在鄰居節點中的中位數
$T\left(v_{i}\right)=\tilde{\mathbf{x}}_{i}=\left[\tilde{x}_{1}, \tilde{x}_{2}, \cdots, \tilde{x}_{m}\right]$

$\tilde{x}_{k}=\operatorname{Median}\left(w_{i 1} \mathbf{x}_{1 k}, w_{i 2} \mathbf{x}_{2 k}, \cdots, w_{i|\mathcal{N}(i)| \mathbf{X}|\mathcal{N}(i)| k}\right)$

Attribute-aware Skip-gram Model

給定節點 $v_i$ 和屬性 $x_i$ ，對於所有的隨機遊走 $c\in C$ ，最小化以下損失函數
$\mathcal{L}_{s g}=-\sum_{i=1}^{n} \sum_{c \in C} \sum_{b \leq b, j \neq 0} \log p\left(v_{i+j} | \mathbf{x}_{i}\right){\tag 3}$
條件概率定義爲：
$p\left(v_{i+j} | \mathbf{x}_{i}\right)=\frac{\exp \left(\mathbf{v}_{i+j}^{\prime} f\left(\mathbf{x}_{i}\right)\right)}{\sum_{v=1}^{n} \exp \left(\mathbf{v}_{v}^{\prime T} f\left(\mathbf{x}_{i}\right)\right)}{\tag 4}$
其中 $\mathbf{V}_{i}^{\prime}$ 是節點 $v_i$ 作爲上下文節點時的表示， $f(\cdot)$ 可以是任意屬性編碼函數，如用於圖像數據的CNN或者用於序列數據的RNN。

上式直接計算開銷大，用負採樣進行優化：
$\log \sigma\left(\mathbf{v}_{i+j}^{\prime \mathrm{T}} f\left(\mathbf{x}_{i}\right)\right)+\sum_{s=1}^{ | \text { neg } |} \mathbb{E}_{v_{n} \sim P_{n}(v)}\left[\log \sigma\left(-\mathbf{v}_{n}^{\mathrm{T}} f\left(\mathbf{x}_{i}\right)\right)\right]{\tag 5}$
負樣本的概率分佈採用word2vec論文裏採用的 $P_{n}(v) \propto d_{v}^{3 / 4}$

聯合優化

模型包括兩個部分，共享自編碼器的encoder部分。其中左邊分支是一個decoder，重建輸入樣本的鄰居屬性；右邊是用輸入樣本對應表示預測其上下文。

兩個分支都共享了自編碼器的encoder部分，最終表示 $\mathbf{y}_{i}^{(K)}$ 同時捕捉了節點屬性和網絡結構。

聯合損失函數

$\begin{aligned} \mathcal{L} &=\mathcal{L}_{s g}+\alpha \mathcal{L}_{a e}+\beta \mathcal{L}_{r e g} \\ &=-\sum_{i=1}^{n} \sum_{c \in C-b \leq j \leq b, j \neq 0} \log \frac{\exp \left(\mathbf{u}_{i+j}^{\mathrm{T}} \mathbf{y}_{i}^{(K)}\right)}{\sum_{v=1}^{n} \exp \left(\mathbf{u}_{v}^{\mathrm{T}} \mathbf{y}_{i}^{(K)}\right)} \\ &+\alpha \sum_{i=1}^{n}\left\|\hat{\mathbf{x}}_{i}-T\left(v_{i}\right)\right\|_{2}^{2}+\frac{\beta}{2} \sum_{k=1}^{K}\left(\left\|\mathbf{W}^{(k)}\right\|_{F}^{2}+\left\|\hat{\mathbf{W}}^{(k)}\right\|_{F}^{2}\right) \end{aligned}$

其中n是節點總數，C是隨機遊走產生的節點序列，b是窗口大小。 $\mathbf{x}_i$ 表示節點 $v_i$ 的屬性， $\boldsymbol{y}_{i}^{(K)}$ 是節點 $v_i$ 的表示。 $\boldsymbol{W}^{(k)}, \boldsymbol{W}^{(k)}$ 分別是encoder和decoder第k層的權重矩陣。 $\mathbf{U}$ 是圖結構上下文預測部分的權重矩陣， $\boldsymbol{u}_{\boldsymbol{v}}$ 是 $\mathbf{U}$ 的第v列。

訓練

Q&A

$f(\cdot)$ 具體的作用和最終使用的函數

看了作者源碼實現裏直接用最後的表示 $\mathbf{y}_{i}^{(K)}$ 計算skip-gram的loss，並沒有使用CNN或RNN。

def make_skipgram_loss(self):
        loss = tf.reduce_sum(tf.nn.sampled_softmax_loss(
            weights=self.nce_weights,
            biases=self.nce_biases,
            labels=self.labels,
            inputs=self.Y,
            num_sampled=self.config.num_sampled,
            num_classes=self.N))

        return loss

$\mathcal{L}_{s g}$ 和 $\mathcal{L}_{\text { ae }}$ 爲什麼不能同時優化？不同時優化，分步進行的先後順序是否有影響？

BiNE中也是兩項loss的組合，然後分開優化
文中自編碼器的輸入和輸出不同，與傳統的自編碼器用法帶來的額外好處是什麼？

【網絡表示學習】ANRL

模型

Neighbor Enhancement Autoencoder

Attribute-aware Skip-gram Model

聯合優化

聯合損失函數

訓練

Q&A

AI 畫圖真刺激，手把手教你如何用 ComfyUI 來畫出刺激的圖

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

數據展示動態（跑分）顯示

公衆號5月C#/.NET熱文一覽

git 下載大陸鏡像地址

【leetcode】1087 字母切換（回溯）

【leetcode】551 學生出勤記錄I

【leetcode】303 區域和檢索 - 數組不可變（前綴和）

【leetcode】340 至多包含 K 個不同字符的最長子串（滑動窗口，雙指針）

【leetcode】5 最長迴文子串（雙指針、動態規劃）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結