NOTE【数据分析】变量间的关系

1. 不相关:

相互间没有线性关系。随机变量 X 和 Y 的相关系数 r(X,Y)=0。

2. 独立:

若同时发生等于各自发生的乘积,即满足P(AB) = P(A)P(B), 那么A B 互相独立。

独立一定不相关,但不相关不一定独立。

3. 互不相容:

若不能同时发生,则不相容,A∩B= Φ。

4. 对立:

在互不相容的基础上再加上一个条件,P(A)+P(B)=1,则为对立。有你没我,有我没你,咱俩之间必须有一个。

 

相关关系与相关系数

简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。

其中,

:X与Y的协方差; 
:X的方差; :为Y的方差;

方差:衡量离散程度

协方差:

衡量两个变量的总体误差,表示两个变量总体误差的期望。

而方差表示一个变量的误差。

如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

如果XY是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]。

但是,反过来并不成立。即如果XY的协方差为0,二者并不一定是统计独立的。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章