相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變量之間線性相關程度的量,一般用字母 r 表示。由於研究對象的不同,相關係數有多種定義方式,較爲常用的是皮爾遜相關係數(PPMCC或PCCs)。
在自然科學領域中,皮爾遜相關係數廣泛用於度量兩個變量之間的相關程度,其值介於-1與1之間。
兩個變量之間的皮爾遜相關係數定義爲兩個變量之間的協方差和標準差的商:
上式定義了總體相關係數,常用希臘小寫字母 作爲代表符號。估算樣本的協方差和標準差,可得到皮爾遜相關係數,常用英文小寫字母 代表:
r的取值範圍:
- 爲正相關,爲負相關
- 代表不存在線性關係
- 代表完全線性相關
參考:
百度百科