搞懂標準差和方差

原創

2023-02-15 12:56

標準差和方差

差的意思是離正常有多遠

標準差

標準差是數值分散的測量。

標準差的符號是 σ （希臘語字母西格馬，英語 sigma）

公式很簡單：方差的平方根。那麼…… "方差是什麼？"

方差

方差的定義是：

離平均的平方距離的平均。

按照以下的步驟來計算方差：

求數值的平均
從每一個數值減去平均，然後求差的平方。
求結果的平均。（爲什麼要求平方？)

例子

你和朋友們量度了狗狗的身高（毫米）：

身高（到肩膀）是：600mm、470mm、170mm、430mm 和 300mm。

求平均、方差和標準差。

第一步是求平均：

答案：

平均 = 600 + 470 + 170 + 430 + 3005 = 19705 = 394

平均身高是 394 mm。我們畫在圖上：

接着求每條狗和平均的距離：

要計算方差，求每個距離的平方，然後求平均：

方差是 21,704

標準差是方差的平方根：

標準差

σ	= √21,704
	= 147.32……
	= 147 （到最近的毫米）

標準差很有用。我們現在可以顯示哪個高度是在離平均一個標準差（147mm）之內：

標準差是一個甄別數值是正常與否的"標準"。

羅德維拉犬是高的狗，臘腸犬是矮的狗……但不要告訴它們！

現在去試試標準差計算器。

可是……如果數據是樣本數據

以上例子的數據是對象總體的數據（我們的對象就是那 5條狗）。

但如果數據是個樣本（只是對象總體的一部分），計算便會有點改變！

如果你有 "N"個數值，而這些數值是：

對象總體：在求方差時除以 N（如上）
樣本：在求方差時除以 N-1

其他的計算步驟不變，包括計算平均在內。

例子：如果我們的 5條狗只是更多狗裏的的一個樣本，我們便要除以 4，而不是除以 5：

樣本方差 = 108,520 / 4 = 27,130

樣本標準差 = √27,130 = 164 （到最近的毫米）

想象這是對樣本數據的 "修補"。

公式

這是在標準差公式網頁裏的兩個公式（你可以去看看來了解更多）：

"對象總體標準差"：
"樣本標準差"：

乍看很複雜，但其實只是在計算樣本方差時，有個重要的改變：
以除以 N-1 來代替除以 N。

*腳註：爲什麼要求差的平方？

如果我們只把和平均的差加起來……負值和正值便會互相抵消：

4 + 4 − 4 − 44 = 0

這不行。我們可以用絕對值嗎？

|4| + |4| + |−4| + |−4|4 = 4 + 4 + 4 + 44 = 4

不錯（這叫平均差），但看看這個例子：

|7| + |1| + |−6| + |−2|4 = 7 + 1 + 6 + 24 = 4

糟了！數據比較分散，但結果還是 4。

我們來試試求每個差的平方（最後才取平方根）：

		√(4² + 4² + 4² + 4²4) = √(644) = 4
		√(7² + 1² + 6² + 2²4) = √(904) = 4.74...

好極了！當數據比較分散時，標準差也比較大……正是我們想要的。

其實這個方法和兩點之間的距離都是基於同一個原理，不過應用不同而已。

同時，用代數來處理平方和平方根比處理絕對值要容易很多，標準差也比較容易被應用在其他數學領域。

樣本標準差的理解：

樣本標準差的意義是用於估計總體標準差，你需要理解下面2個內容：

1）當你選擇一個樣本後，相比總體，你擁有數據的數量是變少了，因此，與總體中的數值偏離平均值的程度相比，樣本中很有可能把較爲極端的數值排除在外，這樣使得數值更有可能以更緊密的方式聚集在均值周圍。

也就是說，樣本的標準差要小於總體標準差。

深藍區域是距平均值小於一個標準差之內的數值範圍，在正態分佈中，此範圍所佔比率爲全部數值之68%；兩個標準差之內（深藍，藍）的比率合起來爲95%；三個標準差之內（深藍，藍，淺藍）的比率合起來爲99.7%。

所以，爲了更好的用樣本估計總體的標準差，統計學家就將標準差的公式做了改造：即原來的標準差公式是除以n，爲了用樣本估計總體標準差，現在是除以n-1。這樣就使得標準差略大。彌補了樣本的標準差小於總體標準差的不足。

所以很多書上會直接把除以n-1的標準差叫做樣本標準，其實這個樣本標準差的目的是用於估計總體標準差。

2）你可能會疑惑，那我什麼時候標準差除以n還是n-1呢？

這是由數學推理得出的：估計量的偏差

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

搞懂標準差和方差

標準差和方差

標準差

方差

例子

答案：

可是……如果數據是樣本數據

公式

*腳註：爲什麼要求差的平方？

C#開源的兩款功能強大的錄屏神器

認知提升的方法

螞蟻面試：Springcloud核心組件的底層原理，你知道多少？

根據經緯度、方向、距離求終點位置

三角函數公式，沒人比我全【手冊】【圖文】

你真的會看Linux硬件信息？【補盲】

搞懂標準差和方差

理解Golang 賦值的併發安全性

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結