SAS 二元邏輯迴歸 預測下月是否會消費

數據集來自 UCI

UCI_Credit_Card.csv

數據集信息

此數據集包含有關2005年4月至2005年9月臺灣地區信用卡客戶的默認付款,人口統計因素,信用數據,付款歷史和賬單的信息。

內容

有25個變量:

ID:每個客戶的ID

LIMIT_BAL:以新臺幣計的給定信用額度(包括個人和家庭/輔助信用額)

性別:性別(1 =男性,2 =女性)

教育程度:(1 =研究生院,2 =大學,3 =高中,4 =其他,5 =未知,6 =未知)

婚姻:婚姻狀況(1 =已婚,2 =單,3 =其他)

年齡:歲

PAY_0:2005年9月的還款狀態(-1 =正常付款,1 =延遲一個月的付款,2 =延遲兩個月的付款,... 8 =延遲八個月的付款,9 =延遲九個月的付款,以及以上)

PAY_2:2005年8月的還款狀態(與上述相同)

PAY_3:2005年7月的還款狀態(與上述相同)

PAY_4:2005年6月的還款狀態(與上述金額相同)

PAY_5:2005年5月的還款狀態(與上述相同)

PAY_6:2005年4月的還款狀態(與上述相同)

BILL_AMT1:2005年9月的帳單金額(新臺幣)

BILL_AMT2:2005年8月的帳單金額(新臺幣)

BILL_AMT3:2005年7月的帳單金額(新臺幣)

BILL_AMT4:2005年6月的帳單金額(新臺幣)

BILL_AMT5:2005年5月的對帳單金額(新臺幣)

BILL_AMT6:2005年4月的帳單金額(新臺幣)

PAY_AMT1:2005年9月的先前付款金額(新臺幣)

PAY_AMT2:2005年8月的先前付款金額(新臺幣)

PAY_AMT3:2005年7月的先前付款金額(新臺幣)

PAY_AMT4:2005年6月的先前付款金額(新臺幣)

PAY_AMT5:2005年5月的先前付款金額(新臺幣)

PAY_AMT6:2005年4月的先前付款金額(新臺幣)

default.payment.next.month:默認付款(1 =是,0 =否)

 

SAS 環境:SAS STUDIO大學版

首先對數據進行數據描述,得到大致的數據概況。然後對缺失值處理

然後對數據進行歸一化,這裏用到的是STUDIO 的標準化模塊

 

 

使用任務模塊的二元邏輯迴歸

導入相應的預測值,分類變量,以及歸一化完的數值連續變量

使用了默認的建模參數

 

然後輸出模型結果:

 
模型信息
數據集 WORK.STDIZE
響應變量 default_payment_next_month
響應水平數 2
模型 二元 Logit
優化方法 Fisher 評分法
 
讀取的觀測數 30000
使用的觀測數 30000
 
響應概略
有序
default_payment_next_month
頻數
1 0 23364
2 1 6636

建模的概率爲 default_payment_next_month='1'。

 
分類水平信息
分類 設計變量
SEX 1 1 0          
  2 0 1          
EDUCATION 0 1 0 0 0 0 0 0
  1 0 1 0 0 0 0 0
  2 0 0 1 0 0 0 0
  3 0 0 0 1 0 0 0
  4 0 0 0 0 1 0 0
  5 0 0 0 0 0 1 0
  6 0 0 0 0 0 0 1
MARRIAGE 0 1 0 0 0      
  1 0 1 0 0      
  2 0 0 1 0      
  3 0 0 0 1      
 
模型收斂狀態
滿足收斂準則 (GCONV=1E-8)。
 
模型擬合統計量
準則 僅截距 截距和協變量
AIC 31707.354 27889.258
SC 31715.663 28146.835
-2 Log L 31705.354 27827.258
 
檢驗全局原假設: BETA=0
檢驗 卡方 自由度 Pr > 卡方
似然比 3878.0967 30 <.0001
評分 3749.8174 30 <.0001
Wald 3061.8299 30 <.0001
 
3 型效應分析
效應 自由度 Wald
卡方
Pr > 卡方
SEX 1 13.4141 0.0002
EDUCATION 6 41.4162 <.0001
MARRIAGE 3 35.5147 <.0001
Standardized_PAY_0 1 1063.4129 <.0001
Standardized_PAY_2 1 16.2970 <.0001
Standardized_PAY_3 1 9.9461 0.0016
Standardized_PAY_4 1 0.8093 0.3683
Standardized_PAY_5 1 1.6349 0.2010
Standardized_PAY_6 1 0.0968 0.7557
Standardized_BILL_AM 1 23.4764 <.0001
Standardized_BILL_AM 1 2.5703 0.1089
Standardized_BILL_AM 1 1.0333 0.3094
Standardized_BILL_AM 1 0.0108 0.9172
Standardized_BILL_AM 1 0.2491 0.6177
Standardized_BILL_AM 1 0.0267 0.8701
Standardized_PAY_AMT 1 35.0031 <.0001
Standardized_PAY_AMT 1 20.6781 <.0001
Standardized_PAY_AMT 1 2.3634 0.1242
Standardized_PAY_AMT 1 5.1893 0.0227
Standardized_PAY_AMT 1 3.2759 0.0703
Standardized_PAY_AMT 1 2.6011 0.1068
AGE 1 8.3249 0.0039
LIMIT_BAL 1 19.6728 <.0001
 
最大似然估計分析
參數   自由度 估計 標準
誤差
Wald
卡方
Pr > 卡方
Intercept   1 -1.7913 0.4332 17.0983 <.0001
SEX 1 1 0.1125 0.0307 13.4141 0.0002
SEX 2 0 0 . . .
EDUCATION 0 1 -9.5675 85.2395 0.0126 0.9106
EDUCATION 1 1 0.3025 0.4035 0.5619 0.4535
EDUCATION 2 1 0.2179 0.4031 0.2924 0.5887
EDUCATION 3 1 0.1961 0.4038 0.2358 0.6273
EDUCATION 4 1 -0.8448 0.5642 2.2418 0.1343
EDUCATION 5 1 -1.0607 0.4747 4.9925 0.0255
EDUCATION 6 0 0 . . .
MARRIAGE 0 1 -1.2406 0.5329 5.4196 0.0199
MARRIAGE 1 1 0.0788 0.1373 0.3288 0.5664
MARRIAGE 2 1 -0.1102 0.1388 0.6301 0.4273
MARRIAGE 3 0 0 . . .
Standardized_PAY_0   1 0.6491 0.0199 1063.4129 <.0001
Standardized_PAY_2   1 0.0976 0.0242 16.2970 <.0001
Standardized_PAY_3   1 0.0854 0.0271 9.9461 0.0016
Standardized_PAY_4   1 0.0263 0.0292 0.8093 0.3683
Standardized_PAY_5   1 0.0390 0.0305 1.6349 0.2010
Standardized_PAY_6   1 0.00793 0.0255 0.0968 0.7557
Standardized_BILL_AM   1 -0.4060 0.0838 23.4764 <.0001
Standardized_BILL_AM   1 0.1717 0.1071 2.5703 0.1089
Standardized_BILL_AM   1 0.0933 0.0918 1.0333 0.3094
Standardized_BILL_AM   1 -0.00904 0.0869 0.0108 0.9172
Standardized_BILL_AM   1 0.0461 0.0925 0.2491 0.6177
Standardized_BILL_AM   1 0.0116 0.0711 0.0267 0.8701
Standardized_PAY_AMT   1 -0.2260 0.0382 35.0031 <.0001
Standardized_PAY_AMT   1 -0.2187 0.0481 20.6781 <.0001
Standardized_PAY_AMT   1 -0.0465 0.0302 2.3634 0.1242
Standardized_PAY_AMT   1 -0.0637 0.0280 5.1893 0.0227
Standardized_PAY_AMT   1 -0.0491 0.0271 3.2759 0.0703
Standardized_PAY_AMT   1 -0.0372 0.0231 2.6011 0.1068
AGE   1 0.00537 0.00186 8.3249 0.0039
LIMIT_BAL   1 -7E-7 1.578E-7 19.6728 <.0001
 
優比估計
效應 點估計 95% Wald
置信限
SEX 2-1 1.119 1.054 1.189
EDUCATION 6-0 <0.001 <0.001 >999.999
EDUCATION 6-1 1.353 0.614 2.985
EDUCATION 6-2 1.244 0.564 2.740
EDUCATION 6-3 1.217 0.551 2.684
EDUCATION 6-4 0.430 0.142 1.298
EDUCATION 6-5 0.346 0.137 0.878
MARRIAGE 3-0 0.289 0.102 0.822
MARRIAGE 3-1 1.082 0.827 1.416
MARRIAGE 3-2 0.896 0.682 1.176
Standardized_PAY_0 1.914 1.841 1.990
Standardized_PAY_2 1.103 1.052 1.156
Standardized_PAY_3 1.089 1.033 1.148
Standardized_PAY_4 1.027 0.969 1.087
Standardized_PAY_5 1.040 0.979 1.104
Standardized_PAY_6 1.008 0.959 1.060
Standardized_BILL_AM 0.666 0.565 0.785
Standardized_BILL_AM 1.187 0.963 1.465
Standardized_BILL_AM 1.098 0.917 1.314
Standardized_BILL_AM 0.991 0.836 1.175
Standardized_BILL_AM 1.047 0.874 1.255
Standardized_BILL_AM 1.012 0.880 1.163
Standardized_PAY_AMT 0.798 0.740 0.860
Standardized_PAY_AMT 0.804 0.731 0.883
Standardized_PAY_AMT 0.955 0.900 1.013
Standardized_PAY_AMT 0.938 0.888 0.991
Standardized_PAY_AMT 0.952 0.903 1.004
Standardized_PAY_AMT 0.963 0.921 1.008
AGE 1.005 1.002 1.009
LIMIT_BAL 1.000 1.000 1.000
 
預測概率和觀測響應的關聯
一致部分所佔百分比 72.6 Somers D 0.452
不一致部分所佔百分比 27.4 Gamma 0.452
結值百分比 0.0 Tau-a 0.156
155043504 c 0.726
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章