统计学4

中心极限定理
中心极限定理是最基础、意义最重大的概念之一。根据该定理,任意良好定义了均值和方差的分布,不管该分布是连续还是离散的,随着样本容量增大,所有样本和或者样本均值或者众数极差等统计量都符合正态分布

样本均值的抽样分布
抽样分布来自于原分布,这里我们求的是样本均值,由原分布的样本得到。
比如,下图的离散概率分布,可以看出不可能是正态分布
这里写图片描述
下面我们取该随机变量的样本,求其平均值,然后看其平均值的频率。
假设样本容量是4,第一次取样{1 1 3 6},平均值为2.75;第二次取样{3 4 3 1},平均值为2.75;第三次取样{1 1 6 6},平均值为3.5。我们要进行很多次抽样,然后对每次的4个样本值进行平均。将所有平均值画到一个频率分布中,可以得到一个正态分布,其均值μx¯ 和原分布的均值μ 基本一样。如果样本容量增大,则正态分布的均值不变,但标准差、峰度和偏度比原来更小了,更近似于正态分布。因为样本容量n越大,越难取到概率低的样本,所以样本均值的分布会更有可能趋近于原分布的均值。比如每次取100万个样本值,此时的样本均值是总体均值的很好估计,样本均值μx¯ 都会落在靠总体均值μ 很近的地方。
这里写图片描述

假设n=1,也就是一次抽取一个值,平均值也是它本身。这时不管进行多少次试验,都不会像正态分布,因为永远也取不到2和5。所以随着n趋于 时,样本均值的抽样分布趋于完美正态分布。其实n=10或15已经很接近正态分布了。
这里写图片描述


其实样本均值的抽样分布的方差σ2x¯ 与原分布的方差σ2 之间的关系也有公式,即σ2x¯=σ2n 。这显然取决于样本容量的大小,样本容量与样本均值分布的方差是反向关系。
样本均值抽样分布的标准差σx¯ 通常称作均值标准误差。
这里写图片描述
这里写图片描述
n=16时,验证σx¯ =9.3/4=2.325
n=25时,验证σx¯ =9.3/5=1.86

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章