均方誤差(Mean Squared Error,MSE)
在相同測量條件下的測量稱爲等精度測量,例如在同樣的條件下,用同一個遊標卡尺測量銅棒的直徑若干次,這就是等精度測量。對於等精度測量來說,還有一種更好的表示誤差的方法,就是標準誤差。
標準誤差定義爲各測量值誤差的平方和的平均值的平方根。
設n個測量值的誤差爲ε1、ε2……εn,則這組測量值的標準誤差σ等於:
數理統計中均方誤差是指參數估計值與參數真值之差平方的期望值,記爲MSE。MSE是衡量“平均誤差”的一種較方便的方法,MSE可以評價數據的變化程度,MSE的值越小,說明預測模型描述實驗數據具有更好的精確度。與此相對應的,還有均方根誤差RMSE、平均絕對百分誤差等等
先來複習三個概念
一、方差
方差是在概率論和統計方差衡量隨機變量或一組數據的離散程度的度量方式,方差越大,離散度越大。求解公式爲,各隨機變量與平均值差值的平方和的平均數(先求差,再平方,再平均)
平均數:M=nx1+x2+......+xn
方差公式:s2=n(x1−M)2+(x2−M)2+.....+(xn−M)2
也可以通過以下的方式進行求解方差:
D(x)=E(x2)−(E(x))2
二、標準差
標準差就是方差的算術平方根,它反映組內個體間的離散程度。因此它的過程是與平均值之間進行差值計算。
標準差
σ=n11∑k(xi−μ)2
三、樣本方差
σ^2=n−11i=1∑n(xi−μ)2
由於樣本方差是無偏估計的,所以它更多被採用。
1.SSE(和方差)
在統計學裏,該參數計算的是擬合數據與原始數據對應點的誤差的平方和,計算公式爲:
SSE=i=1∑mwi(yi−yi^)2
其中yi是真實數據,yi^是擬合數據,wi>0,從這裏可以看出SSE越接近於0,說明模型選擇和擬合更好。
2.MSE(均方方差)
該統計參數是預測數據和原始數據對應點誤差的平方和的均值,也就是nSSE,和SSE沒有太大的區別,計算公式爲:
MSE=nSSE=n1i=1∑mwi(yi−yi^)2
其中n爲樣本的個數
3.RMSE(均方根)
該統計參數,也叫回歸系統的擬合標準差,是MSE的平方根,計算公式爲
MSE=MSE=nSSE=n1i=1∑mwi(yi−yi^)2