Towards Evaluating the Robustness of Neural Networks

原創

MTandHJ

2020-06-22 11:32

文章目錄

Nicholas Carlini, David Wagner, Towards Evaluating the Robustness of Neural Networks

概

提出了在不同範數下 $\ell_0, \ell_2, \ell_{\infty}$ 下生成adversarial samples的方法, 實驗證明此類方法很有效.

主要內容

基本的概念

本文主要針對多分類問題, 假設神經網絡 $F:x \in \mathbb{R}^n \rightarrow y \in \mathbb{R}^m$ , 其網絡參數爲 $\theta$ .

假設:
$F(x)=\mathrm{softmax}(Z(x))=y,$
其中 $\mathrm{softmax}(x)_i=\frac{e^{x_i}}{\sum_j e^{x_j}}$ .

$C(x) = \arg \max_i F(x)_i,$
爲 $x$ 的預測類, 不妨設 $C^*(x)$ 爲其真實的類別.

Adversarial samples 的目標就是構建一個與 $x$ 相差無幾的 $x'$ ( $\|x-x'\|$ 足夠小)，但是 $C(x')\not =C^*(x)$ . 很多構建Adversarial samples可以指定類別:

Average Case: 在不正確的標籤中隨機選取類別;
Best Case: 對所有不正確的標籤生成Adversariak samples, 並選擇最容易成功(即騙過網絡)的類別;
Worst Case:對所有不正確的標籤生成Adversariak samples, 並選擇最不容易成功的類別.

文章中介紹了不少現有的方法, 這裏不多贅述.

目標函數

一般可以通過如下問題求解 $x'=x+\delta$ :
$\begin{array}{ll} \min & \mathcal{D}(x, x+\delta) \\ \mathrm{s.t.} & C(x+\delta)=t \\ & x + \delta \in [0, 1]^n, \end{array}$
其中 $\mathcal{D}$ 衡量 $x,x+\delta$ 之間的距離, 常常爲 $\ell_0, \ell_2, \ell_{\infty}$ .

但是 $C(x+\delta)=t$ 這個條件離散, 這個問題很難直接求解, 作者給出的思路是構造一些函數 $f(x,t)$ , 使得當且僅當 $f(x,t)\le0$ 的時候此條件滿足.
則問題轉換爲:
$\begin{array}{ll} \min & \mathcal{D}(x, x+\delta) \\ \mathrm{s.t.} & f(x,t) \le 0 \\ & x + \delta \in [0, 1]^n, \end{array}$
進一步
$\begin{array}{ll} \min & \mathcal{D}(x, x+\delta) + cf(x,t) \\ \mathrm{s.t.} & x + \delta \in [0, 1]^n. \end{array}$
作者給出了7種符合此類條件的函數(作者尤爲推薦第6種):

如何選擇c

binary search

如何應對Box約束

圖片的元素需要滿足 $0\le x_i \le 1$ , 如何滿足此約束:

簡單粗暴地對其裁剪, 大於1的爲1, 小於0的爲0, 但是這種方法在梯度下降方法比較複雜(如帶momentum)的時候效果可能不會太好(既然momemtum要記錄變量改變的方向, 而我們又擅自對此方向進行更改);
用 $f(\min (\max(x+\delta,0),1)$ 替代 $f(x+\delta)$ , 我的理解是, 每次不改變原變量 $x'$ , 然後把clip後的 $x'$ 餵給 $f$ . 作者說此類方法容易方法在次優解間來回振盪的現象;
定義
$\delta_i = \frac{1}{2}(\tanh (w_i) +1)-x_i,$
於是我們只需優化 $w_i$ , 且保證 $x_i + \delta_i \in [0, 1]$ .

$L_2$ attack

$\min \quad \|\frac{1}{2}(\tanh(w)+1)-x\|_2^2+c\cdot f(\frac{1}{2}(\tanh(w)+1), t),$
其中
$f(x',t)=\max(\max \{Z(x')_i:i \not =t\}-Z(x')_t, -\kappa),$
是對第6種方法的一個小改進, 其中 $\kappa$ 反應了我們對誤判發生的信心.

$L_0$ attack

因爲 $L_0$ 範數不可微, 所以每一次, 我們先利用 $L_2$ attack來尋找合適的 $\delta$ , 令 $g=\nabla f(x+\delta)$ , 根據 $g_i \delta_i$ 判斷每個像素點的重要性, 最不重要的我們刪去(根據文中的意思是永久刪去).

Input: $x, c$
$I=\empty$
Do …:
1. 計算在 $L_2$ 下的解 $x+\delta$ （倘若在 $c$ 下找不到, 則在 $2c$ 條件下找(嵌套)）;
2. $g=\nabla f(x+\delta)$ ;
3. $i=\arg \min_i g_i \cdot \delta_i, i \not \in I$ , 然後 $I=I \cup \{i\}$ ;

在利用 $L_2$ 尋找 $\delta$ 的過程中, 若失敗, 令 $c=2c$ 並重復進行, 直到其成功或者超過了最大的迭代次數.

$L_{\infty}$ attack

$\|\delta\|_{\infty}$ 作爲懲罰項(?)只會針對個別元素, 這在實際實驗的時候並不友好, 往往會出現振盪, 於是作者想了一種替代
$\min \quad c \cdot f( x+ \delta) + \sum_i [(\delta_i-\tau)^+],$
這樣我們就把可以關注部分突出而非個別.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Towards Evaluating the Robustness of Neural Networks

文章目錄

概

主要內容

基本的概念

目標函數

如何選擇c

如何應對Box約束

$L_2$ attack

$L_0$ attack

$L_{\infty}$ attack

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

Max-Mahalanobis Linear Discriminant Analysis Networks

KKT (LICQ)

Differential Evolution: A Survey of the State-of-the-Art

Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach

Geometric GAN

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

Towards Evaluating the Robustness of Neural Networks

文章目錄

概

主要內容

基本的概念

目標函數

如何選擇c

如何應對Box約束

L2L_2L2​ attack

L0L_0L0​ attack

L∞L_{\infty}L∞​ attack

$L_2$ attack

$L_0$ attack

$L_{\infty}$ attack