數據離散程度的指標——標準差

標準差(Standard Deviation)

標準差,在概率統計中最常使用作爲統計分佈程度(statisticaldispersion)上的測量。反應組內個體間的離散程度。

標準差的計算(Calculation of standard deviation)

標準差的計算公式爲:
σ=1Ni=1N(xiμ)2 \sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}

舉個例子:農場種植的某種水稻,連續6年的年平均產量如下(單位:500g):

品種 第一年 第二年 第三年 第四年 第五年 第六年
產量 900 920 900 850 910 920

第一步:計算均值
用希臘字母μ表示水稻產量的均值
μ=x1+x2+x3+x4+x5+x66\mu=\frac{x_{1}+x_{2}+x_{3}+x_{4}+x_{5}+x_{6}}{6}
第二步:計算每年產量與均值的差,並將結果平方
(x1μ1)2\left(x_{1}-\mu_{1}\right)^{2}
(x2μ)2\left(x_{2}-\mu\right)^{2}
(x3μ1)2\left(x_{3}-\mu_{1}\right)^{2}
(x4μ1)2\left(x_{4}-\mu_{1}\right)^{2}
(x5μ1)2\left(x_{5}-\mu_{1}\right)^{2}
(x6μ1)2\left(x_{6}-\mu_{1}\right)^{2}
第三步:計算將差值平方後的均值
1N[(x1μ)2+(x2μ)2+(x3μ)2+(x4μ)2+(x5μ)2+(x6μ)2]\frac{1}{N}\left[\left(x_{1}-\mu\right)^{2}+\left(x_{2}-\mu\right)^{2}+\left(x_{3}-\mu\right)^{2}+\left(x_{4}-\mu\right)^{2}+\left(x_{5}-\mu\right)^{2}+\left(x_{6}-\mu\right)^{2}\right]
第四步:將結果開平方
1N[(x1μ)2+(x2μ)2+(x3μ)2+(x4μ)2+(x5μ)2+(x6μ)2]\sqrt{\frac{1}{N}\left[\left(x_{1}-\mu\right)^{2}+\left(x_{2}-\mu\right)^{2}+\left(x_{3}-\mu\right)^{2}+\left(x_{4}-\mu\right)^{2}+\left(x_{5}-\mu\right)^{2}+\left(x_{6}-\mu\right)^{2}\right]}

DONE!

且慢…還有

樣本標準差

有時候我們的數據只是龐大的數據中心的一個樣本
這種情況下仍可以計算標準差。
但我們用樣本數據來對整個數據的情況進行估算,對樣本數據的標準差計算公式做一些調整
s=1N1i=1N(xixˉ)2 s=\sqrt{\frac{1}{N-1} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)^{2}}
最重要的變化是將最上面的公式中的N換成了N-1,N-1的使用被稱爲“貝塞爾校正”。

Why Take a Sample?
爲什麼要抽樣計算?
Mostly because it is easier and cheaper.
主要是因爲抽樣計算的方式比較簡單,成本更低一些。

但是當我們做採樣統計的時候,我們就會損失一些數據的精確性。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章