相關係數及matlab實現

原創

ColdOrCoder

2020-02-20 18:05

統計相關係數簡介

由於使用的統計相關係數比較頻繁，所以這裏就利用幾篇文章簡單介紹一下這些係數。

相關係數：考察兩個事物（在數據裏我們稱之爲變量）之間的相關程度。

如果有兩個變量：X、Y，最終計算出的相關係數的含義可以有如下理解：

(1)、當相關係數爲0時，X和Y兩變量無關係。

(2)、當X的值增大（減小），Y值增大（減小），兩個變量爲正相關，相關係數在0.00與1.00之間。

(3)、當X的值增大（減小），Y值減小（增大），兩個變量爲負相關，相關係數在-1.00與0.00之間。

相關係數的絕對值越大，相關性越強，相關係數越接近於1或-1，相關度越強，相關係數越接近於0，相關度越弱。

通常情況下通過以下取值範圍判斷變量的相關強度：
相關係數     0.8-1.0     極強相關
                 0.6-0.8     強相關
                 0.4-0.6     中等程度相關
                 0.2-0.4     弱相關
                 0.0-0.2     極弱相關或無相關

Pearson（皮爾遜）相關係數

1、簡介

皮爾遜相關也稱爲積差相關（或積矩相關）是英國統計學家皮爾遜於20世紀提出的一種計算直線相關的方法。

假設有兩個變量X、Y，那麼兩變量間的皮爾遜相關係數可通過以下公式計算：

公式一：

公式二：

公式三：

公式四：

以上列出的四個公式等價，其中E是數學期望，cov表示協方差，N表示變量取值的個數。

2、適用範圍

當兩個變量的標準差都不爲零時，相關係數纔有定義，皮爾遜相關係數適用於：

(1)、兩個變量之間是線性關係，都是連續數據。

(2)、兩個變量的總體是正態分佈，或接近正態的單峯分佈。

(3)、兩個變量的觀測值是成對的，每對觀測值之間相互獨立。

3、Matlab實現

皮爾遜相關係數的Matlab實現（依據公式四實現）：

[cpp]view
plaincopy

function coeff = myPearson(X , Y)  

% 本函數實現了皮爾遜相關係數的計算操作  

%  

% 輸入：  

%   X：輸入的數值序列  

%   Y：輸入的數值序列  

%  

% 輸出：  

%   coeff：兩個輸入數值序列X，Y的相關係數  

%  

if length(X) ~= length(Y)  

    error('兩個數值數列的維數不相等');  

    return;  

end  

fenzi = sum(X .* Y) - (sum(X) * sum(Y)) / length(X);  

fenmu = sqrt((sum(X .^2) - sum(X)^2 / length(X)) * (sum(Y .^2) - sum(Y)^2 / length(X)));  

coeff = fenzi / fenmu;  

end %函數myPearson結束

也可以使用Matlab中已有的函數計算皮爾遜相關係數：

[cpp]view
plaincopy

coeff = corr(X , Y);  

4、參考內容

http://zh.wikipedia.org/zh-cn/%E7%9B%B8%E5%85%B3

轉載自：http://blog.csdn.net/wsywl/article/details/5727327

站內首發文章

ColdOrCoder

發佈了20 篇原創文章 · 獲贊 5 · 訪問量 6萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關係數及matlab實現

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

J2EE的體系架構

HDOJ Humble Numbers（java）

從B樹、B+樹、B*樹談到R 樹

相關係數及matlab實現

十條建議，讓你的簡歷脫穎而出

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結