method_CCA(canonical correlation analysis)

原創

2020-02-26 00:36

Canonical Correlation Analysis(CCA)典型相關分析也是一種常用的降維算法。我們知道，PCA(Principal Component Analysis) 主分量分析將數據從高維映射到低維空間同時，保證了數據的分散性儘可能地大, 也就是數據的方差或者協方差儘可能大。而LDA(Linear Discriminant Analysis) 線性判別分析則利用了類標籤，利用一種監督學習的方法，將數據從高維空間映射到低維空間時，讓不同類的數據儘可能地分開而同一類的數據儘可能地聚合。

但是，有的時候，我們想探討多個線性空間之間的相關性。比如有的時候我們會從圖像中提取各種特徵，每一種特徵都可以構成一個線性空間，爲了分析這些空間之間的相關性，我們可以利用CCA 來做分析。

假設我們有兩個特徵空間，(x1x2), 我們可以將兩個特徵向量合併。

x = (x 1 x 2) E (x) = (μ 1 μ 2) Σ = (Σ 11 Σ 21 Σ 12 Σ 22) (Σ 11 Σ 21 Σ 12 Σ 22)

\mathbf{x} =

\quad E(\mathbf{x}) =

[Math Processing Error] \quad \Sigma =

[Math Processing Error]

可以看到，Σ12=ΣT21(Σ−11100Σ−122), 假設投影之後的變量滿足:

u = a T x 1 v = b T x 2 (Σ 11 0 0 Σ 22)

可以進一步算出 u,v(0Σ21Σ120) 的方差和協方差:

var (u) = a T Σ 11 a, var (v) = b T Σ 2 b, c o v (u, v) = a T Σ 12 b

可以計算出 u,v 的相關係數:

C o r r (u, v) = cov ( u , v ) var ( u ) - - - - - \sqrt var ( v ) - - - - - \sqrt

將u,v的表達式代入，可以得到:

C o r r (u, v) = a T Σ 12 b a T Σ 11 a - - - - - - \sqrt b T Σ 22 b - - - - - - - \sqrt

我們的目標是讓相關係數Corr(u,v), 可以固定分母而讓分子最大化，所以上面的函數可以變成:

max a, b a T Σ 12 b

s . t . a T Σ 11 a = 1, b T Σ 22 b = 1

構造拉格朗日等式:

L = a T Σ 12 b - λ 1 2 (a T Σ 11 a - 1) - λ 2 2 (b T Σ 22 b - 1)

L 求導，可以得到:

\partial L \partial a = Σ 12 b - λ 1 Σ 11 a = 0

\partial L \partial b = Σ 21 a - λ 2 Σ 22 b = 0

根據約束條件，可以得到:

λ 1 = λ 2 = a T Σ 12 b

所以只要求出 λ1.

通過上面的偏導數，我們可以得到:

Σ - 1 11 Σ 12 b = λ a

Σ - 1 22 Σ 21 a = λ b

寫成矩陣形式:

(Σ - 1 11 0 0 Σ - 1 22) (0 Σ 21 Σ 12 0) (a b) = λ (a b)

[Math Processing Error]

[Math Processing Error] =\lambda

[Math Processing Error]

令:

B = (Σ 11 0 0 Σ 22), A = (0 Σ 21 Σ 12 0) w = (a b)

[Math Processing Error] , \quad A=

[Math Processing Error] \quad \mathbf{w}=\begin{pmatrix} \mathbf{a} \\ \mathbf{b} ,
那麼，上式可以表示成:

B - 1 A w = λ w

所以,λ 的特徵值和特徵向量，然後利用特徵向量將原來的特徵
x1,x2 的求解，可以有更簡單的方法，從上面的偏導數，我們可以得到如下等式:

Σ - 1 11 Σ 12 Σ - 1 22 Σ 21 a = λ 2 a

我們可以利用上面的表達式求出 λ.

λ 的特徵值從大到小排列，可以求出一系列的典型變量。特徵值越大，說明典型變量的相關性越強。

參考來源：
http://www.cnblogs.com/jerrylead/archive/2011/06/20/2085491.html
https://en.wikipedia.org/wiki/Canonical_correlation

            <link rel="stylesheet" href="http://s.csdnimg.cn/static/markdown/markdown_views.css?v=2.0">
                </div>

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

method_CCA(canonical correlation analysis)

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

LLE（locally linear embedding）原理介紹

method_LLE(Locally linear embdding)

機器學習中的最優化方法進階

method_LPP(Locality preserving projections)

algo_KNN(k-nearest neighbor)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結