注意:本筆記以文字概括爲主,公式爲輔,問爲啥,因爲貼圖片和打公式對於我來說,太煩啦~所以,就只把每個章節裏覺得重要的一些概念記下來。
書籍:《計量經濟學(第三版)》–李子奈
經典單方程計量經濟學:一元線性迴歸模型
2.1迴歸分析概述
一、迴歸分析基本概念
●各種經濟變量間的關係可分爲兩類:一類是確定的函數關係,另一類是不確定的統計相關關係。
●相關分析與迴歸分析主要研究非確定性現象間的統計相關關係
●迴歸分析的目的在於通過解釋變量的已知值或設定值,去估計和預測被解釋變量的(總體)均值
●相關分析與迴歸分析的聯繫與區別:
①首先,兩者都是研究非確定性變量間的統計依賴關係,並能度量線性依賴程度的大小。
②其次,兩者間又有明顯的區別。相關分析僅僅是從統計數據上測度變量間的相關程度,而無須考察兩者問是否有因果關係,因此,變量的地位在相關分析中是對稱的,而且都是隨機變量;迴歸分析則更關注具有統計相關關係的變量間的因果關係分析,變量的地位是不對稱的,有解釋變量與被解釋變量之分,而且解釋變量也往往被假設爲非隨機變量。
③再次,相關分析只關注變量間的聯繫程度,不關注具體的依賴關係:而回歸分析則更加關注變量間的具體依賴關係,因此可以進一步通過解釋變量的變化來估計或預測被解釋變量的變化,達到深入分析變量間依存關係,掌握其運動規律的目的。
●迴歸分析的主要內容:
①根據樣本觀察值對計量經濟學模型參數進行估計,求得迴歸方程
②對迴歸方程、參數估計值進行顯著性檢驗
③利用迴歸方程進行分析、評價及預測
二、總體迴歸函數
●在給定解釋變量X條件下被解釋變量Y的期望軌跡稱爲總體迴歸線。或更一般地稱爲總體迴歸曲線。相應的函數:
稱爲(雙變量)總體迴歸函數.總體迴歸函數表明被解釋變量Y的平均狀態(總體條件期望)隨解釋變量X變化的規律。至於具體的函數形式,是由所考察總體固有的特徵來決定的。
●線性總體迴歸函數:
其中,β0和β1是未知參數,稱爲迴歸係數。線性函數形式最爲簡單,其中參數的估計與檢驗也相對容易,而且多數非線性函數可轉換爲線性形式,因此,爲了研究的方便,計量經濟學中總體迴歸函數常設定成線性形式。
●經典計量經濟方法中所涉及的線性函數,指回歸係數是線性的,即迴歸係數只以它的一次方出現,對解釋變量則可以不是線性的。
三、隨機干擾性
●隨機干擾項μ:
●總體迴歸函數的隨機形式:
●在總體迴歸函數中引入隨機干擾項,主要有以下幾個方面的原因:
①代表未知的影響因素
②代表殘缺數據
③代表衆多細小影響因素
④代表數據觀測誤差
⑤代表模型設定誤差
⑥變量的內在隨機性
當隨機干擾項僅包含上述③和⑥時,稱爲“原生”的隨機干擾,是模型所固有的;當隨機干擾項包含上述①②④⑤,稱之爲“衍生”的隨機誤差,是在模型設定過程中產生的。
四、樣本回歸函數
●由於樣本取自總體,可用該直線近似地代表總體迴歸線該直線稱爲樣本迴歸線,其函數形式記爲:
稱之爲樣本回歸函數。
●同樣地,樣本回歸函數也有如下的隨機形式:
其中,e稱爲(樣本)殘差(或剩餘)項,代表了其他影響Y的隨機因素的集合。由於方程中引入了隨機項,成爲計量經濟學模型,因此也稱之爲樣本回歸模型。
2.2一元線性迴歸模型的基本假設
●爲了保證參數估計量具有良好的性質,通常對模型提出若干基本假設:
對模型設定的假設:
①迴歸模型是正確設定的
對解釋變量的假設:
②解釋變量X是確定性變量,不是隨機變量,在重複抽樣中取固定值
③解釋變量X在所抽取的樣本中具有變異性,而且隨着樣本容量的無限增加,解釋變量X的樣本方差趨於一個非零的有限常數。
對隨機干擾項的假設:
④隨機誤差項u具有給定X條件下的零均值、同方差以及不序列相關性。
⑤隨機誤差項u與解釋變量X之間不相關
⑥隨機誤差項服從零均值、同方差的正太分佈。
以上假設也稱爲線性迴歸模型的經典假設;而前4個假設也稱爲高斯馬爾科夫假設。
2.3一元線性迴歸模型的參數估計
●常見的估計方法有3種:
普通最小二乘法(OLS)
最大似然法(ML)
矩估計法(MM)
四、最小二乘估計量的統計性質
●估計量的統計性質:
前3個準則也稱爲有限樣本性質,或者小樣本性質。擁有這些性質的估計量稱爲最佳線性無偏估計量(BLUE)
後3個準則稱爲估計量的無限樣本性質或大樣本漸進性質。如果有限樣本情況下不能滿足估計的準則,則應該擴大樣本容量,考察參數估計量的大樣本性質。
五、參數估計量的概率分佈及隨機干擾項方差的估計
●爲了達到對所估計參數精度測定的目的,還需進一步確定參數估計量的概
率分佈。
2.4一元線性迴歸模型的統計檢驗
●在一次抽樣中,參數的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統計檢驗,主要包括擬合優度檢驗、變量的顯著性檢驗及參數的置信區間估計。
一、擬合優度檢驗
●擬合優度檢驗,顧名思義,是檢驗模型對樣本觀測值的擬合程度。
●有人也許會問,採用普通最小二乘法進行估計,已經保證了模型最好地擬合了樣本觀測值,爲什麼還要檢驗擬合程度呢?
最小二乘的確是擬合最好地,但我們也要找出擬合程度有多大。
●可決係數R2統計量:
TSS爲總離差平方和,ESS爲迴歸平方和,RSS爲殘差平方和。
檢驗模型的擬合優度,稱R2爲可決係數(coefficient of determination)。顯然,在總離差平方和中,迴歸平方和所佔的比重越大,殘差平方和所佔的比重越小,迴歸直線與樣本點擬合得越好。如果模型與樣本觀測值完全擬合,則有R2=1。當然,模型與樣本觀測值完全擬合的情況很少發生,R2=1的情況較少。但毫無疑問的是該統計量越接近於1,模型的擬合優度越高。
二、變量的顯著性檢驗
●變量的顯著性檢驗,旨在對模型中被解釋變量與解釋變量之間線性關係是否顯著成立作出判斷,或者說考察所選擇的解釋變量是否對被解釋變量有顯著的線性影響。
●變量的顯著性檢驗所應用的方法是數理統計學中的假設檢驗。
三、參數的置信區間估計
●假設檢驗可以通過一次抽樣的結果,檢驗總體參數可能值的範圍,但它並沒有指出在一次抽樣中樣本參數值,到底距總體參數的真值有多近。往往我們要構造一個以樣本參數的估計值爲中心的“區間”,來考察它以多大的可能性包含着真實的參數值。
●如何才能縮小置信區間?
①增大樣本容量n
②提高模型的擬合優度
2.5一元線性迴歸分析的應用:預測問題
●預測在更大的程度上說是一個區間估計問題,我們得到的僅是預測值的一個估計值,預測值僅以某一個置信度處於該估計值爲中心的一個區間裏。
●對於被解釋變量Y的總體均值E(Y0)與個別值Y0的預測區間,有:
①樣本容量n越大,預測精度越高,反之預測精度越低。
②樣本容量一定時,置信帶的寬度在X的均值處最小,在其附近進行預測(插值預測)精度高;X越遠離其均值,置信帶越寬,預測精度將降低。