基於PCA的線性監督分類的故障診斷方法
數據預處理
訓練集樣本(只有正樣本)爲 Xn∗m (需要列均值爲零,採用z-score歸一化即可),每行一個樣本,樣本數目n,特徵維度m。
計算m個特徵之間的協方差矩陣(也有文獻是除以n):
m∗m∑=n−11XTX
求協方差矩陣的特徵值λi與特徵向量pi,並將特徵值按從小達到順序排列:
λ1≥λ2≥⋯≥λk≥λk+1≥⋯≥λm
將特徵向量按照對應的特徵值重新排列。假設排序後爲:
Vm∗m=[p1,p2,⋯,pm]
按照某個原則(如特徵值累計和的佔比),選擇前k個特徵值進行PCA降維。令前k個從大到小的特徵值構成對角陣Sk∗k,k個對應的特徵向量組成降維矩陣Pm∗k。即:
Sk∗k=diag(λ1,λ2,⋯,λk)
Pm∗k=[p1,p2,⋯,pk]
PCA降維之後,樣本數目仍爲n,特徵數目變爲k,降維公式:
X~n∗k=XP
注:重構公式是(X’是X降維後重構得到的矩陣):
X′=X~n∗kPT=XPPT
T2統計量的計算
對於新樣本xnew(m∗1),(注:應使用訓練樣本歸一化的參數對新樣本歸一化操作),其T2統計量計算公式如下:
T2=xnewTPS−1PTxnew=∥∥∥S−1/2PTxnew∥∥∥22
其中S−1/2表示對矩陣中每個非零元素(非零的那些λ)取-1/2指數。∥∙∥2是向量2範數。
T2統計量的控制限計算公式:
Tα=n(n−k)k(n2−1)Fα(k,n−k)
其中,1−α是置信度,Fα(k,n−k)是服從第一自由度爲k,第二自由度爲n-k的F分佈。
注:由於不同地方似乎對α稱呼不一致,此處特指滿足一下概率公式的α:
P{F(n1,n2)>Fα(n1,n2)}=α
所以,在此定義下,α取值通常爲0.01左右。由於定義相反,有的文獻則是0.99左右。
故障判定
如系統正常運行,則樣本的T2值應該滿足T2<Tα,反之,可認爲出現故障。
參考鏈接:
https://wenku.baidu.com/view/b9ef2df9dd3383c4bb4cd2e0.html
SPE統計量(也稱Q統計量)的計算
對於新樣本xnew(m∗1),其SPE統計量計算公式如下:
SPE=xnewT(I−PPT)xnew
SPE統計量的控制限計算公式:
Qα=θ1[θ1cαh02θ2+1+θ12θ2h0(h0−1)]1/h0
其中:
θr=j=k+1∑mλjr(r=1,2,3)
h0=1−3θ222θ1θ3
cα是標準正態分佈的置信極限,滿足如下公式:
P{N(0,1)>Ncα(0,1)}=cα
所以,這種定義方式下α也是取值0.01左右。
故障判定
如系統正常運行,則樣本的SPE值應該滿足SPE<Qα,反之,可認爲出現故障。
參考鏈接:
https://wenku.baidu.com/view/b9ef2df9dd3383c4bb4cd2e0.html
https://wenku.baidu.com/view/f8b6c51c08a1284ac9504339.html