標準差(Standard Deviation)
標準差,在概率統計中最常使用作爲統計分佈程度(statisticaldispersion)上的測量。反應組內個體間的離散程度。
標準差的計算(Calculation of standard deviation)
標準差的計算公式爲:
σ=N1i=1∑N(xi−μ)2
舉個例子:農場種植的某種水稻,連續6年的年平均產量如下(單位:500g):
品種 |
第一年 |
第二年 |
第三年 |
第四年 |
第五年 |
第六年 |
產量 |
900 |
920 |
900 |
850 |
910 |
920 |
第一步:計算均值
用希臘字母μ表示水稻產量的均值
μ=6x1+x2+x3+x4+x5+x6
第二步:計算每年產量與均值的差,並將結果平方
(x1−μ1)2
(x2−μ)2
(x3−μ1)2
(x4−μ1)2
(x5−μ1)2
(x6−μ1)2
第三步:計算將差值平方後的均值
N1[(x1−μ)2+(x2−μ)2+(x3−μ)2+(x4−μ)2+(x5−μ)2+(x6−μ)2]
第四步:將結果開平方
N1[(x1−μ)2+(x2−μ)2+(x3−μ)2+(x4−μ)2+(x5−μ)2+(x6−μ)2]
DONE!
且慢…還有
樣本標準差
有時候我們的數據只是龐大的數據中心的一個樣本
這種情況下仍可以計算標準差。
但我們用樣本數據來對整個數據的情況進行估算,對樣本數據的標準差計算公式做一些調整:
s=N−11i=1∑N(xi−xˉ)2
最重要的變化是將最上面的公式中的N換成了N-1,N-1的使用被稱爲“貝塞爾校正”。
Why Take a Sample?
爲什麼要抽樣計算?
Mostly because it is easier and cheaper.
主要是因爲抽樣計算的方式比較簡單,成本更低一些。
但是當我們做採樣統計的時候,我們就會損失一些數據的精確性。