概率論和數理統計-名詞解釋

一、概率論

1.核密度估計
2.特徵函數

二、數理統計

  1. 偏回歸係數:多元線性迴歸方程Y=a+b1X+b2X+…+bmXm中,各個自變量Xi的係數bi(i=1,2,…,m),稱爲應變量Y對自變量Xi的偏回歸係數,相應的總體偏回歸係數用βi表示。bi表示當其他自變量取值固定時,Xj變化(增加或減少)1個單位,則Y平均變化bi個單位,是反映Y隨Xi數量變化的方向和大小(或快慢)的指標。bi>0,Y隨Xi增加而增加;bi<0,Y隨Xi增加而減少。|bi|值越大,Y隨Xi變化越大(或越快)。

  2. 潛變量(Latent Variable)和顯變量(Manifest或Observable Variable):潛變量往往表示某一複雜的無法之間測量的概念或建構。比如,信任、虔誠、社會融合。這些概念可以被操作化成不同的維度以不同的指標(indicator)加以測量。由此,可以看到,一個潛變量往往被建構成多個顯變量(或指標)。不過,請注意,這只是SEM或者心理學/社會學中的“潛變量”在經濟學或統計學中,潛變量所指的含義稍有所不同。舉個例子,比如,2009年一共有200個人報考北大社會學系的研究生,最後我們發現只有20個被錄取了。注意,這裏我們看到的結果是“錄取或未被錄取”(大家都知道,這個可以用logistic模型進行分析)。但實際上,再錄取和未被錄取的背後,實際上隱含着考生的“能力”差異(注意,能力是無法直接觀測的!!),只有能力達到一定程度的考生纔會被錄取,(我們現在衡量能力的辦法是考試成績,比如360及以上就被錄取)。所以,我們看到,在每一個二分變量(0-1變量)背後,實際上都隱含着一個不可觀測的連續型變量(該變量被計量經濟學家或統計學家稱作潛變量),當該連續型潛變量的取值超過一定的量時,就表現爲事件發生了(本例爲,被錄取了)。這一邏輯,換用大家可能都熟悉一種描述就是量變引起質變,發生在潛變量上的量變達到一定程度之後(這是個門檻!)就出現了有0-1變量反映出來的(是vs否、發生vs未發生)質變。質變是我們觀察到的或可以測量的,但量變是隱含着的。

  3. 面板數據:面板數據,即Panel Data,也叫“平行數據”,是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。傳統的計量模型分爲時間序列模型和截面模型,對於前者的深入分析很多超出了經典計量經濟學的範疇,而在金融領域應用較多,而經濟學上往往更加關心的是截面模型。

    面板數據有時間序列和截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度的時間序列或者截面數據排在一條線上有着明顯的不同,整個數據表格像是一個面板,所以把panel data譯作“面板數據”。

  4. 固定效應模型與隨機效應模型:方差分析主要有三種模型:即固定效應模型(fixed effects model),隨機效應模型(random effects model),混合效應模型(mixed effects model)。

    所謂的固定、隨機、混合,主要是針對分組變量而言的。

    固定效應模型,表示你打算比較的就是你現在選中的這幾組。例如,我想比較3種藥物的療效,我的目的就是爲了比較這三種藥的差別,不想往外推廣。這三種藥不是從很多種藥中抽樣出來的,不想推廣到其他的藥物,結論僅限於這三種藥。“固定”的含義正在於此,這三種藥是固定的,不是隨機選擇的。

    隨機效應模型,表示你打算比較的不僅是你的設計中的這幾組,而是想通過對這幾組的比較,推廣到他們所能代表的總體中去。例如,你想知道是否名牌大學的就業率高於普通大學,你選擇了北大、清華、北京工商大學、北京科技大學4所學校進行比較,你的目的不是爲了比較這4所學校之間的就業率差異,而是爲了說明他們所代表的名牌和普通大學之間的差異。你的結論不會僅限於這4所大學,而是要推廣到名牌和普通這樣的一個更廣泛的範圍。“隨機”的含義就在於此,這4所學校是從名牌和普通大學中隨機挑選出來的。

    混合效應模型就比較好理解了,就是既有固定的因素,也有隨機的因素。

    一般來說,只有固定效應模型,纔有必要進行兩兩比較,隨機效應模型沒有必要進行兩兩比較,因爲研究的目的不是爲了比較隨機選中的這些組別。

    固定效應和隨機效應的選擇是大家做面板數據常常要遇到的問題,一個常見的方法是做huasman檢驗,即先估計一個隨機效應,然後做檢驗,如果拒絕零假設,則可以使用固定效應,反之如果接受零假設,則使用隨機效應。但這種方法往往得到事與願違的結果。另一個想法是在建立模型前根據數據性質確定使用那種模型,比如數據是從總體中抽樣得到的,則可以使用隨機效應,比如從N個家庭中抽出了M個樣本,則由於存在隨機抽樣,則建議使用隨機效應,反之如果數據是總體數據,比如31個省市的Gdp,則不存在隨機抽樣問題,可以使用固定效應。同時,從估計自由度角度看,由於固定效應模型要估計每個截面的參數,因此隨機效應比固定效應有較大的自由度。

  5. 方差的解釋率:估計值的方差與總體方差之間的差異就是迴歸方程對方差的解釋率。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章