NOTE【數據分析】變量間的關係

1. 不相關:

相互間沒有線性關係。隨機變量 X 和 Y 的相關係數 r(X,Y)=0。

2. 獨立:

若同時發生等於各自發生的乘積,即滿足P(AB) = P(A)P(B), 那麼A B 互相獨立。

獨立一定不相關,但不相關不一定獨立。

3. 互不相容:

若不能同時發生,則不相容,A∩B= Φ。

4. 對立:

在互不相容的基礎上再加上一個條件,P(A)+P(B)=1,則爲對立。有你沒我,有我沒你,咱倆之間必須有一個。

 

相關關係與相關係數

簡單相關係數:又叫相關係數或線性相關係數,一般用字母r 表示,用來度量兩個變量間的線性關係。

其中,

:X與Y的協方差; 
:X的方差; :爲Y的方差;

方差:衡量離散程度

協方差:

衡量兩個變量的總體誤差,表示兩個變量總體誤差的期望。

而方差表示一個變量的誤差。

如果兩個變量的變化趨勢一致,也就是說如果其中一個大於自身的期望值,另外一個也大於自身的期望值,那麼兩個變量之間的協方差就是正值。 如果兩個變量的變化趨勢相反,即其中一個大於自身的期望值,另外一個卻小於自身的期望值,那麼兩個變量之間的協方差就是負值。

如果XY是統計獨立的,那麼二者之間的協方差就是0,因爲兩個獨立的隨機變量滿足E[XY]=E[X]E[Y]。

但是,反過來並不成立。即如果XY的協方差爲0,二者並不一定是統計獨立的。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章