相關性與迴歸性的區別

http://blog.sina.com.cn/s/blog_5e2bcfd801014tut.html


相關分析與迴歸分析都是研究變量相互關係的分析方法,相關分析是迴歸分析的基礎,而回歸分析則是認識變量之間相關程度的具體形式。
下面分爲三個部分詳細描述兩種分析方法的異同:
第一部分:相關分析
一、相關的含義與種類
(一)相關的含義
相關是指自然與社會現象等客觀現象數量關係的一種表現。
相關關係是指現象之間確實存在的一定的聯繫,但數量關係表現爲不嚴格相互依存關係。即對一個變量或幾個變量定一定值時,另一變量值表現爲在一定範圍內隨機波動,具有非確定性。如:產品銷售收入與廣告費用之間的關係。
(二)相關的種類
1. 根據自變量的多少劃分,可分爲單相關和複相關
2. 根據相關關係的方向劃分,可分爲正相關和負相關
3. 根據變量間相互關係的表現形式劃分,線性相關和非線性相關
4.根據相關關係的程度劃分,可分爲不相關、完全相關和不完全相關
二、相關分析的意義與內容
(一)相關分析的意義
相關分析是研究變量之間關係的緊密程度,並用相關係數或指數來表示。其目的是揭示現象之間是否存在相關關係,確定相關關係的表現形式以及確定現象變量間相關關係的密切程度和方向。
(二)相關分析的內容
1. 明確客觀事物之間是否存在相關關係
2. 確定相關關係的性質、方向與密切程度
三、直線相關的測定
(一)相關表與相關圖
1. 相關表
在定性判斷的基礎上,把具有相關關係的兩個量的具體數值按照一定順序平行排列在一張表上,以觀察它們之間的相互關係,這種表就稱爲相關表。
2. 相關圖
把相關表上一一對應的具體數值在直角座標系中用點標出來而形成的散點圖則稱爲相關圖。利用相關圖和相關表,可以更直觀、更形象地表現變量之間的相互關係。
(二)相關係數
1. 相關係數的含義與計算
相關係數是直線相關條件下說明兩個變量之間相關關係密切程度的統計分析指標。相關係數的理論公式爲:
                
(1)   協方差         x的標準差       y的標準差
     (2)  協方差對相關係數 的影響,決定:
2. 相關係數的性質
   (1) 取值範圍:  1    -1   1
   (2) =1    = 1  表明x與y之間存在着確定的函數關係。
   (3) >0 表明兩變量成正相關。   <0  成負相關   =0  不相關
   (4)  1  存在着一定的線性相關; 絕對值越大,相關程度越高。
         <0.3    微弱相關,          0.3  <0.5  低度相關,
0.5  <0.8   顯著相關,        0.8  <1   高度相關。
3. 相關係數運用的幾點說明
(1)計算相關係數時,兩個變量哪個作爲自變量,哪個作爲因變量,對於相關係數的值大小沒有影響。
(2)相關係數指標只能用於直線相關程度的判斷,當其數值很小甚至爲0時只能說明變量之間直線相關程度很弱或者不存在直線相關關係,但不能就此判斷變量之間不存在相關關係。
(3)對於相關係數的絕對值大與0.8時,變量之間存在高度線性相關關係,通常還需要進行相關係數的顯著檢驗。
第二部分:迴歸分析
一、迴歸分析的意義
(一)迴歸分析的含義
對具有相關關係的兩個或兩個以上變量之間的數量變化的一般關係進行測定,確立一個相應的數學方程式,描述變量變動的相互關係,以便從一個已知量來推測另一個未知量,爲估計預測值提供一個重要的方法。根據迴歸分析建立的數學方程稱爲迴歸方程(一元,多元,……)
(二)迴歸分析的種類
1. 按照自變量的個數:一元迴歸與多元迴歸
2. 按照迴歸的表現形式:線性迴歸與非線性迴歸
研究一個因變量與一個自變量之間的線性關係,稱爲一元線性迴歸或簡單線性迴歸;研究一個因變量與多個自變量之間的線性關係,稱爲多元線性迴歸。
(三)一元線性迴歸的特點
1. 迴歸分析是研究兩變量之間的因果關係,所以必須通過定性分析來確定哪個是自變量,哪個是因變量;相關分析則是兩變量之間的關係,沒有自變量和因變量之分。
2. 迴歸方程在進行預測估計時,只能給出自變量的數值求因變量的可能值。即只能由x推出y的估計值 ,而不能據 逆推x。
3. 線性迴歸方程中自變量的係數稱爲迴歸係數,迴歸係數爲正,說明變量正相關,爲負說明負相關
4. 迴歸分析對於因果關係不甚明確,或可以互爲自變量的兩個變量,可以求出y依據 的迴歸方程,還可求出 依據y的迴歸方程;而相關分析中兩個變量的相關程度指標,相關係數是唯一的。
二、一元線性迴歸方程
(一)迴歸方程
    一元線性迴歸方程是用來近似描述兩個具有密切相關關係的變量之間變動關係的數學方程式。該方程在平面座標系中表現爲一條直線,迴歸分析中稱爲迴歸直線,即;
 
 表示y的估計值,藉以區別y的實際觀察值;a表示直線的起點值,即縱軸截距;b表示斜率,即迴歸係數。
(二)  (迴歸係數)與 (相關係數)
          = 
運用數學等量關係式,故有        
1. 因爲 均是正值,所以 的符號是一致的,所以我們可以通過迴歸係數 來確定 的符號,從而來判斷相關的方向。
2. 的大小成正比例,所以還可以利用 來說明相關程度。
三、估計標準誤與區間估計
(一)估計標準誤
    估計標準誤就是實際值與估計值之間的偏差平均程度,用來說明迴歸方程代表性或推算結果的準確程度的分析指標計算公式如下:
        
      是估計標準誤,計算結果若 值越小,說明各個散點離迴歸直線越近,實際值與估計值的偏差越小,迴歸直線的代表性越高,估計越準確可靠;計算結果若 值越大,說明各個散點離迴歸直線越遠,實際值與估計值的偏差越大,迴歸直線的代表性越低,估計準確性越差。
(二)區間估計
    根據變量之間的線性關係,建立直線迴歸方程的目的,在於給定自變量的值來估計因變量的可能值,該估計值是理論值,與實際值之間存在差異,差異的一般水平用估計標準誤來表示,因此可以對因變量的取值範圍作區間估計,而不是隻給一個估計值。
實際值通常以估計值爲中心,上下在一定的區間範圍內波動,在平面座標圖上各個散點總是圍繞回歸趨勢直線上下在一定區間分佈,如果成正態分佈或近似正態分佈,可以用正態分佈的性質對實際值的分佈範圍(區間)進行可靠性估計。
四、應用迴歸分析中應注意的問題
(一)從嚴格意義上講,根據已知的資料建立迴歸方程,應該對迴歸方程的參數的有效性進行顯著性統計檢驗,以判斷迴歸估計的有效性。
(二)利用迴歸直線進行估計預測時,如果所給定的自變量的值在樣本觀察值的區間範圍內,其估計通常比較準確;如果所給定的自變量的值在樣本觀察值的區間範圍之外,一般要求所給定的自變量值不宜偏離樣本觀察數據的平均值太遠,否則預測就會不準確。
 
第三部分:相關分析與迴歸分析的聯繫與區別
  相關分析是迴歸分析的基礎和前提,迴歸分析則是相關分析的深入和繼續。相關分析需要依靠迴歸分析來表現變量之間數量相關的具體形式,而回歸分析則需要依靠相關分析來表現變量之間數量變化的相關程度。只有當變量之間存在高度相關時,進行迴歸分析尋求其相關的具體形式纔有意義。如果在沒有對變量之間是否相關以及相關方向和程度做出正確判斷之前,就進行迴歸分析,很容易造成“虛假迴歸”。與此同時,相關分析只研究變量之間相關的方向和程度,不能推斷變量之間相互關係的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況,因此,在具體應用過程中,只有把相關分析和迴歸分析結合起來,才能達到研究和分析的目的。
  二者的區別主要體現在以下三個方面:
  1.相關分析主要通過相關係數來判斷兩個變量之間是否存在着相互關係及其關係的密切程度,其前提條件是兩個變量都是隨機變量,且變量之間不必區別自變量和因變量。而回歸分析研究一個隨機變量(Y)與另一個非隨機變量(X)之間的相互關係,且變量之間必須區別自變量和因變量。
  2.相關係數只能觀察變量間相關關係的密切程度和方向,不能估計推算具體數值。而回歸分析可以根據迴歸方程,用自變量數值推算因變量的估計值。
3.互爲因果關係的兩個變量,可以擬合兩個迴歸方程,且互相獨立、不能互相替換。而相關係數卻只有一個,即自變量與因變量互換相關係數不變。
 
很重要的一點,變量之間是否存在“真實相關”,是由變量之間的內在聯繫所決定的。相關分析和迴歸分析只是定量分析的手段,通過相關分析和迴歸分析,雖然可以從數量上反映變量之間的聯繫形式及其密切程度,但是無法準確判斷變量之間內在聯繫的存在與否,也無法判斷變量之間的因果關係。因此,在具體應用過程中,一定要始終注意把定性分析和定量分析結合起來,在準確的定性分析的基礎上展開定量分析。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章