Stata軟件做門檻迴歸模型(漢森個人主頁上的代碼)

結合自身在stata軟件實際操作中的經驗,做出門檻迴歸模型的小結如下:

     注:本人採用的是Hansen個人主頁上的代碼完成的,具體代碼請在網上搜索BruceHansen的個人主頁(門檻迴歸創始人)-左下角的Programs and Data--Organized by Subject--Threshold Models--STATA Programs

1、門檻變量的選擇。門檻變量的選擇可由理論模型外生決定,漢森指出,由於門檻迴歸方法是通過對門檻變量進行排序後進行模型估計的,如果門檻變量含有較強的時間趨勢,就會將這種趨勢帶入模型中,趨勢的存在將改變突變點似然分佈檢驗,更重要的是,在這種情況下,置信區間無法構建,使得問題無法研究,因此本文在選取門檻變量時儘量避免選擇帶有趨勢的絕對指標,而選擇相對指標。

2、顯著性檢驗。門檻迴歸模型的實質是利用門檻值將樣本分爲兩組,只有當兩組樣本的估計參數顯著不同時,才使用門檻迴歸模型,否則說明不存在門檻,使用線性模型就可以了,因此必須對模型進行顯著性檢驗。

(1)門檻效應的存在性檢驗:單一門檻存在性檢驗。進行顯著性檢驗的方法是漢森提出的LM(lagrange multiplier)檢驗,原假設爲:

如果零假設H0被拒絕,則表示模型存在機制轉換(即存在門檻);反之,則表示不存在門檻。但是該H0假設表示不存在門檻,這將導致門檻參數無法識別,此時檢驗統計量的大樣本分佈將是受到干擾參數影響的“非標準非相似分佈”(non-standard non-similar),而不是“卡方分佈”,那麼就無法使用模擬的方法得到分佈的臨界值。漢森爲了解決這個問題,利用統計量本身的大樣本分佈函數進行轉換,並使用“自助抽樣法”(bootstrap)進行計算,得到大樣本的漸進p值。如果該p值統計量的大樣本分佈爲均勻分佈,則零假設成立。在對零假設進行統計檢驗時,可以利用LM統計量構造似然比統計量,其公式爲:

式中,S0爲在零假設(即無門檻值)下的殘差平方和加總;S1爲存在門檻效應下的殘差平方和加總。如果拒絕了LM檢驗,則表示模型至少存在一個門檻值,此時要繼續進行兩個門檻值的檢驗。

(2)門檻效應的存在性檢驗:雙重門檻的存在性檢驗(同上)

原假設爲不存在門檻效應: H0∶ β1= β2= β3; 相應的備擇假設?爲 H1∶ β1≠β2(表示至少存在一個門檻)。我們採用自舉抽樣法( Bootstrap) 模擬似然比檢驗的漸進分佈。

似然比檢驗基於如下統計量:

其中,S0爲假設不存在門檻效應時β估計相應的殘差平方和,S(^γ1)爲存在單一門檻效應時β估計相應的殘差平方和。n爲樣本國家個數,T爲時間跨度。在重複多次自舉抽樣計算後,得到原假設H0下F1統計量的漸進p值,如果p值小於臨界值(1%、5%或10%),那麼就拒絕原假設。

【例子】:漢森thresholdtest運行結果:F值(LM檢驗值)爲12.6,對於P值爲0.078.

thresholdtest運行結果中的P值爲0.0788,所以存在一個門檻值,再運行thresholdreg得到具體門檻值。然後再在門檻值左右兩部分分別做thresholdtest和thresholdreg,比較左右部分的thresholdreg結果裏的SSE(殘差平方和),哪個殘差平方和小,對應的門檻值就是第二個門檻值。反過來,再依據第二個門檻值劃分左右兩部分,再在門檻值左右兩部分分別做thresholdtest和thresholdreg,比較左右部分的thresholdreg結果裏的SSE(殘差平方和),哪個殘差平方和小,對應的門檻值就是第一個門檻值。這樣第一、二個門檻值就確定了,各自的迴歸方程也確定了。

結果說明在10%顯著性水平下,存在門檻值,且至少存在一個門檻值。

(3)確定門檻值的個數

在存在門檻效應的基礎上,再確定門檻值的個數。以雙門檻模型爲例。由於雙重門檻模型可能存在兩個也可能存在一個門檻,所以需要對門檻的個數進行檢驗。原假設爲存在單一門檻: H0: β1= β2≠ β3(數字順序可調換,表示僅存在1個門檻值); 相應的備擇假設爲 H1: β1≠ β2≠ β3(至少存在2個門檻值)。該檢驗基於如下統計量:

如果 F2大於臨界值,那麼拒絕僅存在一個門檻的假設。如果不只存在單一門檻,還

需對模型進一步檢驗以確定是雙重門檻、三重門檻、四重門檻…或是 n 重門檻。

(4)確定門檻值的個數的理論過程

就是Sum of Squared Iterval最小時的Threshold Estimate值

3、門檻效應的真實性檢驗

顯著性檢驗只能檢驗樣本是否存在門檻值,如果存在門檻值,但是門檻估計值γ與實際門檻值γ0是否一致卻無法確定。這是因爲存在着干擾參數,它使得漸進分佈呈高度非標準分佈。因此漢森提出使用最大似然估計法求得統計量的漸進分佈,來檢驗門檻估計值γ與門檻實際值γ0是否具有一致性。門檻值檢驗的原假設爲:H0∶γ=γ0 ,其似然比統計量爲式:

 

在確定了門檻值之後,還要構造 γ 的置信區間對“門檻效應”進行真實性檢驗。對於

單一門檻估計值的漸進分佈特徵,設 γ 爲真實值,^γ 爲 γ 的一致估計量,它的分佈是高

度非標準分佈,故利用似然比統計量構造出“非拒絕域”。對於單門檻模型,原假設爲 H0:

^γ1= γ1,似然比統計量爲:

對於雙門檻估計值的漸進分佈特徵,記 ( γ1,γ2) 爲真實值,( ^γ1,^γ2) 爲 ( γ1,γ2)的一致估計量,原假設爲 H0: ( ^γ1,^γ2) = ( γ1,γ2) ,似然比統計量爲:

 

門檻迴歸結果中,係數的t值自己算,t=係數估計值/st error,然後再根據樣本數n和變量數q查t值表得到在1%、5%和10%顯著性水平下的臨界值。拿計算出的t值與臨界值比較。

 

 

 

STATA15軟件中命令threshold默認爲時間序列,並不適用橫截面與面板數據,故首先需要tsset數據,才能使用threshold命令。所以如果對橫截面數據進行門檻迴歸或進行深入的統計推斷,則建議使用門檻迴歸創始人BruceHansen的個人網頁提供的非官方Stata命令(即thresholdreg和thresholdtest命令)

網頁:https://www.ssc.wisc.edu/~bhansen/progs/progs_threshold.html

如果使用面板數據進行門檻迴歸,則建議使用南開大學王羣勇教授的非官方Stata命令xthreg(Wang,2015),在stata中可輸入命令finditxthreg來搜索下載

 

 

 

 

結尾附上漢森程序代碼和含義

在漢森STATA程序文件中有如下5個文件:

原始數據是如下這種形式:

在實際操作中,先運行thresholdtest.ado和thresholdreg.ado文件,再分別運行

thresholdtest GDP_Growth log_GDP InvGDP Pop_Growth school, q(GDP) trim_per(0.15) rep(5000)

來檢驗門檻效應是否存在;

thresholdreg GDP_Growth log_GDP InvGDP Pop_Growth school, q(GDP) h(1)

來做門檻迴歸。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章