概念
典範或平行因子分析(canonical or parallel factor analysis,CANDECOMP/PARAFAC)是由Carroll和Chang以及Harshman與1970年分別獨立提出的數據分析方法,現在習慣合稱爲CP分析。CP分析的基礎是多路數據模型的典範或平行因子分解,簡稱CP分解。
雙線性模型
在數據分析中,給定二路數據矩陣X ∈ R I × J X \in \R^{I \times J} X ∈ R I × J ,二路雙線性分析採用模型
x i j = ∑ r = 1 R a i r b j r + e i j
x_{ij}=\sum_{r=1}^{R}a_{ir}b{jr}+e_{ij}
x i j = r = 1 ∑ R a i r b j r + e i j
擬合二路數據矩陣的各個元素。式中,各參數的含義如下:
x i j x_{ij} x i j 爲I × J I \times J I × J 數據矩陣X X X 第i i i 行、第j j j 列的元素;
R R R 爲因子的個數;
a i r a_{ir} a i r 爲“因子載荷”;
b j r b_{jr} b j r 爲“因子得分”;
e i j e_{ij} e i j 爲數據x i j x_{ij} x i j 的觀測誤差,是I × J I \times J I × J 誤差矩陣E E E 第i i i 行、第j j j 列的元素。
若固定b j r = β r b_{jr}=\beta_r b j r = β r 爲常數,則x i j = ∑ r = 1 R β r a i r x_{ij}=\sum_{r=1}^R \beta_r a_{ir} x i j = ∑ r = 1 R β r a i r 是因子載荷a i r a_{ir} a i r 的線性模型。反之,若固定a i r = α r a_{ir}=\alpha_r a i r = α r 爲常數,則x i j = ∑ r = 1 R α r b j r x_{ij}=\sum_{r=1}^R \alpha_r b_{jr} x i j = ∑ r = 1 R α r b j r 是因子得分b j r b_{jr} b j r 的線性模型。因此,二路數據模型常稱爲二路雙線性模型。