Max-Mahalanobis Linear Discriminant Analysis Networks

原創

2020-07-06 13:57

文章目錄

Pang T, Du C, Zhu J, et al. Max-Mahalanobis Linear Discriminant Analysis Networks[C]. international conference on machine learning, 2018: 4013-4022.

@article{pang2018max-mahalanobis,
title={Max-Mahalanobis Linear Discriminant Analysis Networks},
author={Pang, Tianyu and Du, Chao and Zhu, Jun},
pages={4013–4022},
year={2018}}

概

本文介紹了從最大化馬氏距離的角度提出了一種defense.

主要內容

對於倆個分佈來說, 區分樣本屬於哪一個分佈, 最好的分類器就是貝葉斯分類, 特別的, 如果是高斯分佈, 且協方差矩陣一致, 則其分類平面爲
$w^T(x-x_0)=0,$
其中
$w=\Sigma^{-1} (\mu_1 - \mu_2),$
$x_0=\frac{1}{\mu_1+\mu_2} - \ln (\frac{P(w_1)}{P(w_2)}) \frac{\mu_1-\mu_2}{\|\mu_1-\mu_2\|_{\Sigma^{-1}}^2}.$
特別的, 當 $\Sigma$ 爲對角矩陣的時候, 其分類平面只與 $\mu_1-\mu_2$ 有關.

設一個混合高斯分佈:
$P(y=i)=\pi_i, P(x|y=i)=\mathcal{N}(\mu_i, \Sigma), \quad i \in [L]:=1,\ldots,L,$
並定義
$\Delta_{i,j} := [(\mu_i-\mu_j)^T \Sigma^{-1} (\mu_i - \mu_j)]^{1/2}.$

因爲神經網絡強大的擬合分佈能力, 我們可以假設 $\Sigma=I$ (文中將\Sigma$分解, 然後用變量替換可以得到, 馬氏距離在此情況下具有不變性, 我覺得不如直接這麼解釋比較實在).

設想, 從第i個分佈中採樣 $x_{(i)} \sim \mathcal{N}(\mu_i, I)$ , 將 $x_{(i)}$ 移動到與 $j$ 類的分類平面的距離設爲 $d_{(i,j)}$ ,

定理: 如果 $\pi_i=\pi_j$ , 則 $d_{(i,j)}$ 的期望爲
$\mathbb{E}[d_{(i,j)}] = \sqrt{\frac{2}{\pi}} \exp(-\frac{\Delta_{i,j}^2}{8})+\frac{1}{2} \Delta_{i,j} [1-2\Phi(-\frac{\Delta_{i, j}}{2})],$
其中 $\Phi$ 表示正態分佈函數.

注意, 這裏的 $d_{i,j}$ 是 $x$ 到分類平面的距離, 也就是說, 如果 $x_{(i)}$ 如果本身就位於別的類中, 同樣也計算這個距離, 不公平, 當然如果這麼考慮, 證明起來就相當麻煩了.

如果定義
$\mathrm{RB} = \min_{i,j\in [L]} \mathbb{E}[d_{(i,j)}],$
則我們自然希望 $\mathrm{RB}$ 越大越好(越魯棒, 但是根據我們上面的分析, 這個定義是存在瑕疵的). 然後通過導數, 進一步發現
$\mathrm{RB} \approx \bar{\mathrm{RB}} := \min_{i,j \in [L]} \Delta_{i,j} / 2.$

有定理:

所以, 作者的結論就是, 最後一層
$z_i =\mu_i^Tf(x)+b_i,$
滿足 $(4)$ , 爲此作者設計了一個算法

去構造. 所以, 這最後一層的參數是固定不訓練的. 餘下的與普通的網絡沒有區別.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Max-Mahalanobis Linear Discriminant Analysis Networks

文章目錄

概

主要內容

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

Max-Mahalanobis Linear Discriminant Analysis Networks

KKT (LICQ)

Differential Evolution: A Survey of the State-of-the-Art

Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach

Geometric GAN

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結