SAS 二元逻辑回归 预测下月是否会消费

数据集来自 UCI

UCI_Credit_Card.csv

数据集信息

此数据集包含有关2005年4月至2005年9月台湾地区信用卡客户的默认付款,人口统计因素,信用数据,付款历史和账单的信息。

内容

有25个变量:

ID:每个客户的ID

LIMIT_BAL:以新台币计的给定信用额度(包括个人和家庭/辅助信用额)

性别:性别(1 =男性,2 =女性)

教育程度:(1 =研究生院,2 =大学,3 =高中,4 =其他,5 =未知,6 =未知)

婚姻:婚姻状况(1 =已婚,2 =单,3 =其他)

年龄:岁

PAY_0:2005年9月的还款状态(-1 =正常付款,1 =延迟一个月的付款,2 =延迟两个月的付款,... 8 =延迟八个月的付款,9 =延迟九个月的付款,以及以上)

PAY_2:2005年8月的还款状态(与上述相同)

PAY_3:2005年7月的还款状态(与上述相同)

PAY_4:2005年6月的还款状态(与上述金额相同)

PAY_5:2005年5月的还款状态(与上述相同)

PAY_6:2005年4月的还款状态(与上述相同)

BILL_AMT1:2005年9月的帐单金额(新台币)

BILL_AMT2:2005年8月的帐单金额(新台币)

BILL_AMT3:2005年7月的帐单金额(新台币)

BILL_AMT4:2005年6月的帐单金额(新台币)

BILL_AMT5:2005年5月的对帐单金额(新台币)

BILL_AMT6:2005年4月的帐单金额(新台币)

PAY_AMT1:2005年9月的先前付款金额(新台币)

PAY_AMT2:2005年8月的先前付款金额(新台币)

PAY_AMT3:2005年7月的先前付款金额(新台币)

PAY_AMT4:2005年6月的先前付款金额(新台币)

PAY_AMT5:2005年5月的先前付款金额(新台币)

PAY_AMT6:2005年4月的先前付款金额(新台币)

default.payment.next.month:默认付款(1 =是,0 =否)

 

SAS 环境:SAS STUDIO大学版

首先对数据进行数据描述,得到大致的数据概况。然后对缺失值处理

然后对数据进行归一化,这里用到的是STUDIO 的标准化模块

 

 

使用任务模块的二元逻辑回归

导入相应的预测值,分类变量,以及归一化完的数值连续变量

使用了默认的建模参数

 

然后输出模型结果:

 
模型信息
数据集 WORK.STDIZE
响应变量 default_payment_next_month
响应水平数 2
模型 二元 Logit
优化方法 Fisher 评分法
 
读取的观测数 30000
使用的观测数 30000
 
响应概略
有序
default_payment_next_month
频数
1 0 23364
2 1 6636

建模的概率为 default_payment_next_month='1'。

 
分类水平信息
分类 设计变量
SEX 1 1 0          
  2 0 1          
EDUCATION 0 1 0 0 0 0 0 0
  1 0 1 0 0 0 0 0
  2 0 0 1 0 0 0 0
  3 0 0 0 1 0 0 0
  4 0 0 0 0 1 0 0
  5 0 0 0 0 0 1 0
  6 0 0 0 0 0 0 1
MARRIAGE 0 1 0 0 0      
  1 0 1 0 0      
  2 0 0 1 0      
  3 0 0 0 1      
 
模型收敛状态
满足收敛准则 (GCONV=1E-8)。
 
模型拟合统计量
准则 仅截距 截距和协变量
AIC 31707.354 27889.258
SC 31715.663 28146.835
-2 Log L 31705.354 27827.258
 
检验全局原假设: BETA=0
检验 卡方 自由度 Pr > 卡方
似然比 3878.0967 30 <.0001
评分 3749.8174 30 <.0001
Wald 3061.8299 30 <.0001
 
3 型效应分析
效应 自由度 Wald
卡方
Pr > 卡方
SEX 1 13.4141 0.0002
EDUCATION 6 41.4162 <.0001
MARRIAGE 3 35.5147 <.0001
Standardized_PAY_0 1 1063.4129 <.0001
Standardized_PAY_2 1 16.2970 <.0001
Standardized_PAY_3 1 9.9461 0.0016
Standardized_PAY_4 1 0.8093 0.3683
Standardized_PAY_5 1 1.6349 0.2010
Standardized_PAY_6 1 0.0968 0.7557
Standardized_BILL_AM 1 23.4764 <.0001
Standardized_BILL_AM 1 2.5703 0.1089
Standardized_BILL_AM 1 1.0333 0.3094
Standardized_BILL_AM 1 0.0108 0.9172
Standardized_BILL_AM 1 0.2491 0.6177
Standardized_BILL_AM 1 0.0267 0.8701
Standardized_PAY_AMT 1 35.0031 <.0001
Standardized_PAY_AMT 1 20.6781 <.0001
Standardized_PAY_AMT 1 2.3634 0.1242
Standardized_PAY_AMT 1 5.1893 0.0227
Standardized_PAY_AMT 1 3.2759 0.0703
Standardized_PAY_AMT 1 2.6011 0.1068
AGE 1 8.3249 0.0039
LIMIT_BAL 1 19.6728 <.0001
 
最大似然估计分析
参数   自由度 估计 标准
误差
Wald
卡方
Pr > 卡方
Intercept   1 -1.7913 0.4332 17.0983 <.0001
SEX 1 1 0.1125 0.0307 13.4141 0.0002
SEX 2 0 0 . . .
EDUCATION 0 1 -9.5675 85.2395 0.0126 0.9106
EDUCATION 1 1 0.3025 0.4035 0.5619 0.4535
EDUCATION 2 1 0.2179 0.4031 0.2924 0.5887
EDUCATION 3 1 0.1961 0.4038 0.2358 0.6273
EDUCATION 4 1 -0.8448 0.5642 2.2418 0.1343
EDUCATION 5 1 -1.0607 0.4747 4.9925 0.0255
EDUCATION 6 0 0 . . .
MARRIAGE 0 1 -1.2406 0.5329 5.4196 0.0199
MARRIAGE 1 1 0.0788 0.1373 0.3288 0.5664
MARRIAGE 2 1 -0.1102 0.1388 0.6301 0.4273
MARRIAGE 3 0 0 . . .
Standardized_PAY_0   1 0.6491 0.0199 1063.4129 <.0001
Standardized_PAY_2   1 0.0976 0.0242 16.2970 <.0001
Standardized_PAY_3   1 0.0854 0.0271 9.9461 0.0016
Standardized_PAY_4   1 0.0263 0.0292 0.8093 0.3683
Standardized_PAY_5   1 0.0390 0.0305 1.6349 0.2010
Standardized_PAY_6   1 0.00793 0.0255 0.0968 0.7557
Standardized_BILL_AM   1 -0.4060 0.0838 23.4764 <.0001
Standardized_BILL_AM   1 0.1717 0.1071 2.5703 0.1089
Standardized_BILL_AM   1 0.0933 0.0918 1.0333 0.3094
Standardized_BILL_AM   1 -0.00904 0.0869 0.0108 0.9172
Standardized_BILL_AM   1 0.0461 0.0925 0.2491 0.6177
Standardized_BILL_AM   1 0.0116 0.0711 0.0267 0.8701
Standardized_PAY_AMT   1 -0.2260 0.0382 35.0031 <.0001
Standardized_PAY_AMT   1 -0.2187 0.0481 20.6781 <.0001
Standardized_PAY_AMT   1 -0.0465 0.0302 2.3634 0.1242
Standardized_PAY_AMT   1 -0.0637 0.0280 5.1893 0.0227
Standardized_PAY_AMT   1 -0.0491 0.0271 3.2759 0.0703
Standardized_PAY_AMT   1 -0.0372 0.0231 2.6011 0.1068
AGE   1 0.00537 0.00186 8.3249 0.0039
LIMIT_BAL   1 -7E-7 1.578E-7 19.6728 <.0001
 
优比估计
效应 点估计 95% Wald
置信限
SEX 2-1 1.119 1.054 1.189
EDUCATION 6-0 <0.001 <0.001 >999.999
EDUCATION 6-1 1.353 0.614 2.985
EDUCATION 6-2 1.244 0.564 2.740
EDUCATION 6-3 1.217 0.551 2.684
EDUCATION 6-4 0.430 0.142 1.298
EDUCATION 6-5 0.346 0.137 0.878
MARRIAGE 3-0 0.289 0.102 0.822
MARRIAGE 3-1 1.082 0.827 1.416
MARRIAGE 3-2 0.896 0.682 1.176
Standardized_PAY_0 1.914 1.841 1.990
Standardized_PAY_2 1.103 1.052 1.156
Standardized_PAY_3 1.089 1.033 1.148
Standardized_PAY_4 1.027 0.969 1.087
Standardized_PAY_5 1.040 0.979 1.104
Standardized_PAY_6 1.008 0.959 1.060
Standardized_BILL_AM 0.666 0.565 0.785
Standardized_BILL_AM 1.187 0.963 1.465
Standardized_BILL_AM 1.098 0.917 1.314
Standardized_BILL_AM 0.991 0.836 1.175
Standardized_BILL_AM 1.047 0.874 1.255
Standardized_BILL_AM 1.012 0.880 1.163
Standardized_PAY_AMT 0.798 0.740 0.860
Standardized_PAY_AMT 0.804 0.731 0.883
Standardized_PAY_AMT 0.955 0.900 1.013
Standardized_PAY_AMT 0.938 0.888 0.991
Standardized_PAY_AMT 0.952 0.903 1.004
Standardized_PAY_AMT 0.963 0.921 1.008
AGE 1.005 1.002 1.009
LIMIT_BAL 1.000 1.000 1.000
 
预测概率和观测响应的关联
一致部分所占百分比 72.6 Somers D 0.452
不一致部分所占百分比 27.4 Gamma 0.452
结值百分比 0.0 Tau-a 0.156
155043504 c 0.726
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章