数据离散程度的指标——标准差

标准差(Standard Deviation)

标准差,在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量。反应组内个体间的离散程度。

标准差的计算(Calculation of standard deviation)

标准差的计算公式为:
σ=1Ni=1N(xiμ)2 \sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}

举个例子:农场种植的某种水稻,连续6年的年平均产量如下(单位:500g):

品种 第一年 第二年 第三年 第四年 第五年 第六年
产量 900 920 900 850 910 920

第一步:计算均值
用希腊字母μ表示水稻产量的均值
μ=x1+x2+x3+x4+x5+x66\mu=\frac{x_{1}+x_{2}+x_{3}+x_{4}+x_{5}+x_{6}}{6}
第二步:计算每年产量与均值的差,并将结果平方
(x1μ1)2\left(x_{1}-\mu_{1}\right)^{2}
(x2μ)2\left(x_{2}-\mu\right)^{2}
(x3μ1)2\left(x_{3}-\mu_{1}\right)^{2}
(x4μ1)2\left(x_{4}-\mu_{1}\right)^{2}
(x5μ1)2\left(x_{5}-\mu_{1}\right)^{2}
(x6μ1)2\left(x_{6}-\mu_{1}\right)^{2}
第三步:计算将差值平方后的均值
1N[(x1μ)2+(x2μ)2+(x3μ)2+(x4μ)2+(x5μ)2+(x6μ)2]\frac{1}{N}\left[\left(x_{1}-\mu\right)^{2}+\left(x_{2}-\mu\right)^{2}+\left(x_{3}-\mu\right)^{2}+\left(x_{4}-\mu\right)^{2}+\left(x_{5}-\mu\right)^{2}+\left(x_{6}-\mu\right)^{2}\right]
第四步:将结果开平方
1N[(x1μ)2+(x2μ)2+(x3μ)2+(x4μ)2+(x5μ)2+(x6μ)2]\sqrt{\frac{1}{N}\left[\left(x_{1}-\mu\right)^{2}+\left(x_{2}-\mu\right)^{2}+\left(x_{3}-\mu\right)^{2}+\left(x_{4}-\mu\right)^{2}+\left(x_{5}-\mu\right)^{2}+\left(x_{6}-\mu\right)^{2}\right]}

DONE!

且慢…还有

样本标准差

有时候我们的数据只是庞大的数据中心的一个样本
这种情况下仍可以计算标准差。
但我们用样本数据来对整个数据的情况进行估算,对样本数据的标准差计算公式做一些调整
s=1N1i=1N(xixˉ)2 s=\sqrt{\frac{1}{N-1} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)^{2}}
最重要的变化是将最上面的公式中的N换成了N-1,N-1的使用被称为“贝塞尔校正”。

Why Take a Sample?
为什么要抽样计算?
Mostly because it is easier and cheaper.
主要是因为抽样计算的方式比较简单,成本更低一些。

但是当我们做采样统计的时候,我们就会损失一些数据的精确性。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章