對某從小到大排列的向量 ${{\rm{\vec x}}_{\rm{n}}}$ 的中位數計算方案，定義爲med，即：
${\rm{med(}}{{\rm{\vec x}}_{\rm{n}}}{\rm{) = }}\left\{ \begin{array}{l} ({x_{n/2}} + {x_{(x/2) + 1}})/2{\rm{\;\;if\;}}n{\rm{\;is\;even}}\\ {x_{(n + 1)/2}}{\rm{\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;if\;}}n{\rm{\;is\;odd}} \end{array} \right.$
含義就是，若長度爲偶數，用中間兩個數的均值作爲中位數，若長度爲奇數，用中間那個數作爲中位數。

（3）

對某從小到大排列的向量 ${{\rm{\vec x}}_{\rm{n}}}$ （向量中元素個數爲n），其四分位數計算方案如下：

$Q_1$ 是第一四分位數， $Q_3$ 是第三四分位數，IQR是四分位距：
${{\rm{Q}}_1}({\vec x_n}) = {{\rm{\vec x}}_{{\mathop{\rm int}} (n*0.25)}}$

${{\rm{Q}}_3}({\vec x_n}) = {{\rm{\vec x}}_{{\mathop{\rm int}} (n*0.75)}}$

$IQR({\vec x_n}) = {Q_3}({\vec x_n}) - {Q_1}({\vec x_n})$

注：上面定義的med中位數，可以看成是這裏的第二四分位數。

（4）

medcouple計算方法，記爲MC：
${\rm{MC}}({\rm{\vec x}}) = \mathop {{\rm{med}}}\limits_{{x_i} \le {\rm{med}}({\rm{\vec x}}) \le {x_j}} h({x_i},{x_j})$
其中，核函數 $h({x_i},{x_j})$ 計算方法：

當 ${x_i} \ne {x_j}$ 時：
$h({x_i},{x_j}){\rm{ = }}\frac{{\left| {({x_j} - med({\rm{\vec x}})) - ({x_i} - med(\vec x))} \right|}}{{{x_j} - {x_i}}}$
當 ${x_i}{\rm{ = med}}({\rm{\vec x}}){\rm{ = }}{x_j}$ ，設從小到大的向量 ${{\rm{\vec x}}_{\rm{n}}}$ 中，存在
${x_{b + 1}} = {x_{b + 2}} = ... = {x_{b + i}} = ... = {x_{b + j}} = {x_{b + k}} = med({\rm{\vec x}})$
共k個元素與 ${\rm{med}}({\rm{\vec x}})$ 相等，則：
$h({x_{b + i}},{x_{b + j}}){\rm{ = }}\left\{ \begin{array}{l} {\rm{ - 1, if\;\;}}i + j - {\rm{1 < }}k\\ {\rm{ \;\;\;0 , if\;\;}}i + j - {\rm{1 = }}k\\ {\rm{ + 1, if\;\;}}i + j - {\rm{1 > }}k \end{array} \right.$
可以證明 $h({x_i},{x_j}) \in [ - 1,1]$ 。

注：statsmodels庫提供了medcouple計算函數，並且最新版修復了一個小誤差。

（5）

向量 ${{\rm{\vec x}}_{\rm{n}}}$ 的邊界 $c_1$ 和 $c_2$ （與箱型圖有關的一個量）的計算方法：
$[{c_1}({{\rm{\vec x}}_{\rm{n}}}),{c_2}({{\rm{\vec x}}_{\rm{n}}})] = \left[ {{{\rm{Q}}_1} - 1.5{e^{ - 3.5MC}}IQR{\rm{\;,\;}}{Q_3} + 1.5{e^{4MC}}IQR} \right]{\rm{ if\;MC}}({{\rm{\vec x}}_{\rm{n}}}) \ge {\rm{0}}$

$[{c_1}({{\rm{\vec x}}_{\rm{n}}}),{c_2}({{\rm{\vec x}}_{\rm{n}}})] = \left[ {{{\rm{Q}}_1} - 1.5{e^{ - 4MC}}IQR{\rm{\;,\;}}{Q_3} + 1.5{e^{3.5MC}}IQR} \right]{\rm{ if\;MC}}({{\rm{\vec x}}_{\rm{n}}}) \le {\rm{0}}$

注：上述 $Q_1$ 肯定是向量 ${{\rm{\vec x}}_{\rm{n}}}$ 的 $Q_1$ 值啦，其他類推。

（6）

向量 ${{\rm{\vec x}}_{\rm{n}}}$ 的拒絕策略：
${\rm{cutoff(}}\vec x{\rm{)}} = \left\{ \begin{array}{l} {Q_3}(\vec x) + 1.5{{\rm{e}}^{{\rm{4MC(\vec x)}}}}IQR(\vec x){\rm{\;\;if\;\;MC(}}\vec x{\rm{)}} \ge {\rm{0}}\\ {Q_3}(\vec x) + 1.5{{\rm{e}}^{{\rm{3}}{\rm{.5MC(\vec x)}}}}IQR(\vec x){\rm{\;\;if \;\;MC(}}\vec x{\rm{)}} \le {\rm{0}} \end{array} \right.$
（7）

最爲關鍵的AO統計量的計算公式啦啦啦：

矩陣 ${\rm{X = (}}{\vec x_1},...,{\vec x_i},...,{\vec x_n}{{\rm{)}}^T}$ 的中任一個樣本向量 ${\vec x_i}$ 的AO值計算方法：
${\rm{AO(}}{\vec x_i},{\rm{X) = }}\mathop {\max }\limits_{v \in H} \frac{{\left| {\vec x_i^Tv - med({\rm{X}}v)} \right|}}{{({c_2}({\rm{X}}v) - med({\rm{X}}v))I[\vec x_i^Tv > med({\rm{X}}v)] + (med({\rm{X}}v) - {c_1}({\rm{X}}v))I[\vec x_i^Tv < med({\rm{X}}v)]}}$
其中， ${I[·]}$ 表示當內部條件成立時，該函數結果爲1，否則爲0。（暫不清楚爲何上式內部條件中沒有考慮等於號，實現該函數時，個人覺得可以把等於的情況歸於大於號，即變成大於等於號。）

AO統計量的控制限

同 $I^2$ 統計量的控制限一樣，採用KDE法求取，參見鏈接。

將AO統計量應用於故障診斷的步驟

首先，經過FastICA變換，得到n個樣本的所有源信號s（d維）組成的源矩陣：
${{\rm{S}}_{{\rm{(n*d)}}}}{\rm{ = }}{{\rm{X}}_{{\rm{n*m}}}}{\rm{W}}_{{\rm{d*m}}}^T = {({s_{1(d*1)}},...,{s_{n(d*1)}})^{\rm{T}}}$
求取S所有樣本向量的AO值：
${\rm{AO(S) = [AO(}}{s_{\rm{1}}}{\rm{,S)}},...,{\rm{AO(}}{s_i}{\rm{,S),}}...{\rm{,AO(}}{s_{\rm{n}}}{\rm{,S)}}{{\rm{]}}^T}$
求取AO向量的cutoff值：
${\rm{cutoff = cutoff(AO(S))}}$
若 ${\rm{AO(}}{{\rm{s}}_i}{\rm{) > cutoff}}$ ，則將訓練集樣本 $X_{n*m}$ 中的 ${\vec x_i}$ 標記爲極端值。

從X中剔除掉所有極端值，得到 $X_{robust}$ ，重新進行FastICA，得到 ${S_{robust}}$ 。

計算 $S_{robust}$ 的AO值向量：
${\rm{AO(}}{{\rm{S}}_{{\rm{robust}}}}{\rm{)}}$
採用KDE估計此AO向量的概率密度函數，並求取置信區間，記控制限求取結果爲 ${AO}_{\alpha}$

對於新的樣本矩陣 $X_{new}$ ，採用上述第二次FastICA的參數（包括均值化和變換矩陣等參數）對其進行FastICA變換，得到 ${{\rm{S}}_{{\rm{new}}}}{\rm{ = (}}{\vec s_{\rm{1}}}{\rm{,}}...{\rm{,}}{\vec s_i}{\rm{,}}...{\rm{,}}{\vec s_n}{{\rm{)}}^T}$ ，然後求取AO值（注意新樣本，與訓練樣本此公式的異同）：
${\rm{AO(}}{\vec s_i}{\rm{,}}{{\rm{S}}_{{\rm{robust}}}}{\rm{) = }}\mathop {\max }\limits_{v \in H} \frac{{\left| {\vec s_i^Tv - med({{\rm{S}}_{{\rm{robust}}}}v)} \right|}}{{({c_2}({{\rm{S}}_{{\rm{robust}}}}v) - med({{\rm{S}}_{{\rm{robust}}}}v))I[\vec s_i^Tv > med({{\rm{S}}_{{\rm{robust}}}}v)] + (med({{\rm{S}}_{{\rm{robust}}}}v) - {c_1}({{\rm{S}}_{{\rm{robust}}}}v))I[\vec s_i^Tv < med({{\rm{S}}_{{\rm{robust}}}}v)]}}$

故障判定

如果系統正常運行，新樣本 $x_i$ 的AO值，應滿足 ${\rm{AO}}({\vec s_i}) < {\rm{A}}{{\rm{O}}_\alpha }$ ，反之，認爲出現故障。

參考文獻

Brys, G, M Hubert和A Struyf. 《A Robust Measure of Skewness》. Journal of Computational and Graphical Statistics 13, 期 4 (2004年12月): 996–1017. https://doi.org/10.1198/106186004X12632.

Brys, G., M. Hubert和P. J. Rousseeuw. 《A Robustification of Independent Component Analysis》. Journal of Chemometrics 19, 期 5–7 (2005年5月): 364–75. https://doi.org/10.1002/cem.940.

Hsu, Chun-Chin, Mu-Chen Chen和Long-Sheng Chen. 《A Novel Process Monitoring Approach with Dynamic Independent Component Analysis》. Control Engineering Practice 18, 期 3 (2010年3月): 242–53. https://doi.org/10.1016/j.conengprac.2009.11.002.

Lee, Jong-Min, ChangKyoo Yoo和In-Beum Lee. 《Statistical process monitoring with independent component analysis》. Journal of Process Control 14, 期 5 (2004年8月1日): 467–85. https://doi.org/10.1016/j.jprocont.2003.09.004.

DICA+AO統計量

X(l)生成過程同DPCA，參見鏈接。

剩餘步驟同此。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

基於ICA的線性監督分類的故障診斷方法-AO統計量計算

基於ICA的線性監督分類的故障診斷方法

ICA+AO統計量

數據預處理

AO統計量的計算

必備公式

AO統計量的控制限

將AO統計量應用於故障診斷的步驟

故障判定

參考文獻

DICA+AO統計量

EXCEL中下拉菜單中添加新選項或者刪除選項

號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

同事使用 insert into select 遷移數據，開開心心上線，上線後被公司開除！

Git使用經驗總結5-修改提交信息

Python 爬蟲：Spring Boot 反爬蟲的成功案例

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

Git使用經驗總結4-撤回上一次本地提交

Java中止線程的方式

壓榨數據庫的真實處理速度

國內SaaS遇冷？未來企業服務賽道是否還有機會？

Linux 使用 monit 監控程序運行

調試內核某模塊，打印 pr_debug 信息

記一次 Excel 重裝也無用的崩潰經歷

Codeblocks使用自定義Makefile構建，並運行指定腳本

大端、小端與結構體位域

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結