分位數迴歸(Stata)

基於分位數迴歸的成都空氣質量指數的數據分析

空氣質量指數計算公式爲:

I=\frac{I_{high}-I_{low}}{C_{high}-C_{low}}(C-C_{low})+I_{low}

1)線性迴歸模型得到的是一種條件均值,並未考慮到因變量總體上的分佈特徵,在需要了解因變量位置(分位數)上的信息時,線性迴歸就顯示出了不足。

2)線性(均值)迴歸模型最基本的假設之一正態分佈,隨機誤差且獨立時,通過最小二乘法得到的參數估計值是最小方差無偏估計。但是現實生活中大多數數據是不滿足正態分佈的,這時如果仍然用線性迴歸模型進行分析,由於在假設檢驗中值的計算依賴正態性假設,可能會造成值的有偏性,從而導致假設檢驗無效。若樣本數據中存在異方差性或數據的分佈是尖峯厚尾的,最小二乘估計量則不具有上述的良好性質。

3)當樣本數據中有離羣點存在時,用線性迴歸模型計算得到的參數估計值可能有較大的偏差,因此,在進行迴歸擬合時通常會是在去掉離羣點後建立線性(均值)迴歸模型,但這會使離羣點在一些社會科學研究中喪失研究意義。

而分位數迴歸模型相對於一般的線性(均值)迴歸模型來說,條件更爲寬泛,可以描述因變量的全局特徵,而不只是均值。另一方面,分位數迴歸模型具有穩健性,模型的估計值通常不受離羣點的影響,從這一角度來說,分位數迴歸有較強的穩健性。

Q_{\theta }(y|x)=X^T\beta (\theta )+b(\theta )

模型檢驗:

模型顯著性檢驗(Wald檢驗)、係數的顯著性檢驗(t統計量)、不同分位數模型的聯合相等檢驗、擬合優度檢驗(R方)

實證分析

對AQI作描述性分析,畫出箱線圖和QQ圖

 

樣本數據中AQI的中位數較小,且有較大的離羣點,QQ圖爲一條曲線且不是對稱的,與正態QQ線相差較大,綜合來說,樣本數據中的AQI並不滿足正態分佈,而分位數迴歸模型對數據的分佈沒有要求,因此可以用分位數迴歸模型來分析樣本數據。

爲了消除由於量綱不同對數據的分析結果造成影響,對數據進行歸一化處理,將數據固定在了(0,1)範圍內。

PM2.5PM10SO2CONO2O3濃度爲自變量,以AQI爲因變量,建立分位數分別爲0.250.500.75的位數迴歸模型(QRM)。

不同分位數迴歸模型下係數的顯著性不同,但基本都是有4個變量對AQI的影響是顯著的,並且每個模型中PM2.5濃度對應的係數絕對值最大,說明它對AQI的影響程度最大。

0.05顯著性水平下,只有O3濃度對應的係數在3個模型中是不聯合相等的,即在不同的分位數模型中O3濃度對AQI的影響程度不同,不能隨意剔除,而其他的變量在0.05顯著性水平下是聯合相等的,即在不同的分位數迴歸模型中對AQI影響效果在一定程度上相同,存在剔除的可能。

模型優化:向後剔除法剔除係數不顯著的變量。

下圖描述了在不同分位數水平下的迴歸模型係數的置信區間,分位數從0.010.99上等距變化。圖中深色的曲線表示不同分位數水平下各自變量對應的係數估計值,灰色區域表示係數的95%置信區間,深色虛線表示均值迴歸模型中各系數的估計值,兩側的淺色虛線之間爲均值迴歸模型中係數的95%置信區間。

隨着分位數的增大,各系數的置信區間在逐漸變寬,O3濃度對應的係數估計值的置信區間先變寬後變窄。係數的置信區間變寬說明係數估計值的標準差在逐漸變大,係數估計值的波動性在增強。以上係數置信區間圖中,只有O3濃度對應的係數估計值是具有單調性,不存在“分位數交叉問題”,即在不同的分位數水平下,O3濃度對AQI的影響不同,其餘變量在不同分位數水平下對AQI的影響效果在一定程度上相同。另外,除PM2.5濃度對應的係數估計值基本在均值迴歸模型的係數置信區間內之外,其餘係數的估計值基本不在均值迴歸模型的係數置信區間之內,尤其是低分位數和高分位數上,差別較大,這也進一步說明了均值迴歸模型在一定程度上具有不合理性,分位數迴歸模型可以更好地解釋變量間的關係。

1788個樣本平均分爲3等份,分別爲第1-596597-11921193-1788個樣本數據。對新組成的3個樣本數據重新進行分位數爲0.250.500.75的分位數迴歸模型。

總結:

線性(均值)迴歸模型只是通過擬合均值表達數據的集中趨勢,無法刻畫數據的位置(分位點)上的變化,在滿足假設的情況下,線性(均值)迴歸具有較好的擬合效果,但是分位數迴歸模型具有較好的穩健性,並且能描述數據不同位置(分位點)上的估計值,當數據不滿足假設條件時尤其是數據呈偏態分佈時,分位數迴歸模型擬合效果更好。

部分Stata代碼:
*讀取數據,數據處理
insheet using E:\計量論文\成都市空氣質量指數.csv
rename o3_8h o3
*描述性統計
asdoc sum
*QQ圖
qnorm aqi
*箱線圖
graph box aqi
*相關係數
asdoc pwcorr aqi pm25 pm10 so2 co no2 o3, star(all) nonum replace
*歸一化處理
egen maqi =min(aqi)
egen Maqi =max(aqi)
gen aqi_=(aqi-maqi)/(Maqi-maqi)

egen mpm25 =min(pm25)
egen Mpm25 = max(pm25)
gen pm25_=(pm25-mpm25)/(Mpm25-mpm25)

egen mpm10 =min(pm10)
egen Mpm10 =max(pm10)
gen pm10_=(pm10-mpm10)/(Mpm10-mpm10)

egen mso2 =min(so2)
egen Mso2 =max(so2)
gen so2_=(so2-mso2)/(Mso2-mso2)

egen mco =min(co)
egen Mco =max(co)
gen co_=(co-mco)/(Mco-mco)

egen mno2 =min(no2)
egen Mno2 =max(no2)
gen no2_=(no2-mno2)/(Mno2-mno2)

egen mo3 =min(o3)
egen Mo3 =max(o3)
gen o3_=(o3-mo3)/(Mo3-mo3)

*分位數迴歸
eststo : quietly regress aqi_ pm25_ pm10_ so2_ co_ no2_ o3_
eststo : quietly qreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_ ,quantile(.25)
eststo : quietly qreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_ ,quantile(.50)
eststo : quietly qreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_ ,quantile(.75)
asdoc esttab est2 est3 est4 est5, b p t staraux
*Wald檢驗
qreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_ ,quantile(.25)
test pm25_ pm10_ so2_ co_ no2_ o3_
qreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_ ,quantile(.50)
test pm25_ pm10_ so2_ co_ no2_ o3_
qreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_ ,quantile(.75)
test pm25_ pm10_ so2_ co_ no2_ o3_
*聯合相等檢驗
sqreg aqi_ pm25_ pm10_ so2_ co_ no2_ o3_,q(.25,.50,.75)
test[q25=q50=q75]:pm25_
test[q25=q50=q75]:pm10_
test[q25=q50=q75]:so2_
test[q25=q50=q75]:co_
test[q25=q50=q75]:no2_
test[q25=q50=q75]:o3_
*向後剔除(最終)
eststo : quietly qreg aqi_ pm25_ pm10_ o3_ ,quantile(.25)
eststo : quietly qreg aqi_ pm25_ pm10_ o3_ ,quantile(.50)
eststo : quietly qreg aqi_ pm25_ pm10_ o3_ ,quantile(.75)
asdoc esttab est1 est2 est3 , b p t staraux
*檢驗過程代碼同上
*穩健性檢驗(歸一化代碼同上)
insheet using E:\計量論文\數據1.csv
eststo : quietly qreg aqi1_ pm251_ pm101_ o31_ ,quantile(.25)
eststo : quietly qreg aqi_ pm251_ pm101_ o31_ ,quantile(.50)
eststo : quietly qreg aqi_ pm251_ pm101_ o31_ ,quantile(.75)
asdoc esttab est1 est2 est3 , b p t staraux
insheet using E:\計量論文\數據2.csv
eststo : quietly qreg aqi1_ pm252_ pm102_ o32_ ,quantile(.25)
eststo : quietly qreg aqi_ pm252_ pm102_ o32_ ,quantile(.50)
eststo : quietly qreg aqi_ pm252_ pm102_ o32_ ,quantile(.75)
asdoc esttab est1 est2 est3 , b p t staraux
insheet using E:\計量論文\數據3.csv
eststo : quietly qreg aqi1_ pm253_ pm103_ o33_ ,quantile(.25)
eststo : quietly qreg aqi_ pm253_ pm103_ o33_ ,quantile(.50)
eststo : quietly qreg aqi_ pm253_ pm103_ o33_ ,quantile(.75)
asdoc esttab est1 est2 est3 , b p t staraux

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章