搞懂標準差和方差

標準差和方差

差的意思是離正常有多遠

標準差

標準差是數值分散的測量。

標準差的符號是 σ (希臘語字母 西格馬,英語 sigma)

公式很簡單:方差平方根。那麼…… "方差是什麼?"

方差

方差的定義是:

離平均的平方距離的平均。

按照以下的步驟來計算方差:

例子

你和朋友們量度了狗狗的身高(毫米):
狗圖肩高

身高(到肩膀)是:600mm、470mm、170mm、430mm 和 300mm。

求平均、方差和標準差。

第一步是求平均:

答案:

平均  =  600 + 470 + 170 + 430 + 3005  =  19705  =  394

平均身高是 394 mm。我們畫在圖上:

狗圖:平均

接着求每條狗和平均的距離:

狗圖:差

要計算方差,求每個距離的平方,然後求平均:

方差計算

方差是 21,704

標準差是方差的平方根:

標準差
   
σ = √21,704
  = 147.32……
  147 (到最近的毫米)

 

標準差很有用。 我們現在可以顯示哪個高度是在離平均一個標準差(147mm)之內:
狗圖:標準差

標準差是一個甄別數值是正常與否的"標準"。

羅德維拉犬高的狗,臘腸犬矮的狗……但不要告訴它們!

現在去試試 標準差計算器

可是……如果數據是樣本數據

以上例子的數據是對象總體的數據(我們的對象就是那 5條狗)。

但如果數據是個樣本(只是對象總體的一部分),計算便會有點改變!

如果你有 "N"個數值,而這些數值是:

  • 對象總體:在求方差時除以 N(如上)
  • 樣本:在求方差時除以 N-1

其他的計算步驟不變,包括計算平均在內。

例子:如果我們的 5條狗只是更多狗裏的的一個樣本,我們便要除以 4,而不是除以 5:

樣本方差 = 108,520 / 4 = 27,130
樣本標準差 = √27,130 = 164 (到最近的毫米)

想象這是對樣本數據的 "修補"。

公式

這是在 標準差公式 網頁裏的兩個公式(你可以去看看來了解更多):


"對象總體標準差":

  [(1/N) 乘以 (xi - mu)^2 從 i=1 到 N 的總和] 的平方根
"樣本標準差":   [(1/(N-1)) 乘以 (xi - xbar)^2 從 i=1 to N 的總和] 的平方根

乍看很複雜,但其實只是在計算樣本方差時,有個重要的改變:
以除以 N-1 來代替除以 N

 

 

*腳註:爲什麼要求差的平方

如果我們只把和平均的差加起來……負值和正值便會互相抵消:

標準差爲何 a   4 + 4 − 4 − 44 = 0

這不行。我們可以用絕對值嗎?

標準差爲何 a   |4| + |4| + |−4| + |−4|4 = 4 + 4 + 4 + 44 = 4

不錯(這叫 平均差),但看看這個例子:

標準差爲何 b   |7| + |1| + |−6| + |−2|4 = 7 + 1 + 6 + 24 = 4

糟了!數據比較分散,但結果還是 4。

我們來試試求每個差的平方(最後才取平方根):

標準差爲何 a   √(42 + 42 + 42 + 424) = √(644) = 4
標準差爲何 b   √(72 + 12 + 62 + 224) = √(904) = 4.74...

好極了!當數據比較分散時,標準差也比較大……正是我們想要的。

其實這個方法和 兩點之間的距離 都是基於同一個原理,不過應用不同而已。

同時,用代數來處理平方和平方根比處理絕對值要容易很多,標準差也比較容易被應用在其他數學領域。

 

樣本標準差的理解:

樣本標準差的意義是用於估計總體標準差,你需要理解下面2個內容:

1)當你選擇一個樣本後,相比總體,你擁有數據的數量是變少了,因此,與總體中的數值偏離平均值的程度相比,樣本中很有可能把較爲極端的數值排除在外,這樣使得數值更有可能以更緊密的方式聚集在均值周圍。

也就是說,樣本的標準差要小於總體標準差。

深藍區域是距平均值小於一個標準差之內的數值範圍,在正態分佈中,此範圍所佔比率爲全部數值之68%;兩個標準差之內(深藍,藍)的比率合起來爲95%;三個標準差之內(深藍,藍,淺藍)的比率合起來爲99.7%。

所以,爲了更好的用樣本估計總體的標準差,統計學家就將標準差的公式做了改造:即原來的標準差公式是除以n,爲了用樣本估計總體標準差,現在是除以n-1。這樣就使得標準差略大。彌補了樣本的標準差小於總體標準差的不足。

所以很多書上會直接把除以n-1的標準差叫做樣本標準,其實這個樣本標準差的目的是用於估計總體標準差。

 

2) 你可能會疑惑,那我什麼時候標準差除以n還是n-1呢?

這是由數學推理得出的: 估計量的偏差

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章