标准差(Standard Deviation)
标准差,在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量。反应组内个体间的离散程度。
标准差的计算(Calculation of standard deviation)
标准差的计算公式为:
σ=N1i=1∑N(xi−μ)2
举个例子:农场种植的某种水稻,连续6年的年平均产量如下(单位:500g):
品种 |
第一年 |
第二年 |
第三年 |
第四年 |
第五年 |
第六年 |
产量 |
900 |
920 |
900 |
850 |
910 |
920 |
第一步:计算均值
用希腊字母μ表示水稻产量的均值
μ=6x1+x2+x3+x4+x5+x6
第二步:计算每年产量与均值的差,并将结果平方
(x1−μ1)2
(x2−μ)2
(x3−μ1)2
(x4−μ1)2
(x5−μ1)2
(x6−μ1)2
第三步:计算将差值平方后的均值
N1[(x1−μ)2+(x2−μ)2+(x3−μ)2+(x4−μ)2+(x5−μ)2+(x6−μ)2]
第四步:将结果开平方
N1[(x1−μ)2+(x2−μ)2+(x3−μ)2+(x4−μ)2+(x5−μ)2+(x6−μ)2]
DONE!
且慢…还有
样本标准差
有时候我们的数据只是庞大的数据中心的一个样本
这种情况下仍可以计算标准差。
但我们用样本数据来对整个数据的情况进行估算,对样本数据的标准差计算公式做一些调整:
s=N−11i=1∑N(xi−xˉ)2
最重要的变化是将最上面的公式中的N换成了N-1,N-1的使用被称为“贝塞尔校正”。
Why Take a Sample?
为什么要抽样计算?
Mostly because it is easier and cheaper.
主要是因为抽样计算的方式比较简单,成本更低一些。
但是当我们做采样统计的时候,我们就会损失一些数据的精确性。