数据集来自 UCI
UCI_Credit_Card.csv
数据集信息
此数据集包含有关2005年4月至2005年9月台湾地区信用卡客户的默认付款,人口统计因素,信用数据,付款历史和账单的信息。
内容
有25个变量:
ID:每个客户的ID
LIMIT_BAL:以新台币计的给定信用额度(包括个人和家庭/辅助信用额)
性别:性别(1 =男性,2 =女性)
教育程度:(1 =研究生院,2 =大学,3 =高中,4 =其他,5 =未知,6 =未知)
婚姻:婚姻状况(1 =已婚,2 =单,3 =其他)
年龄:岁
PAY_0:2005年9月的还款状态(-1 =正常付款,1 =延迟一个月的付款,2 =延迟两个月的付款,... 8 =延迟八个月的付款,9 =延迟九个月的付款,以及以上)
PAY_2:2005年8月的还款状态(与上述相同)
PAY_3:2005年7月的还款状态(与上述相同)
PAY_4:2005年6月的还款状态(与上述金额相同)
PAY_5:2005年5月的还款状态(与上述相同)
PAY_6:2005年4月的还款状态(与上述相同)
BILL_AMT1:2005年9月的帐单金额(新台币)
BILL_AMT2:2005年8月的帐单金额(新台币)
BILL_AMT3:2005年7月的帐单金额(新台币)
BILL_AMT4:2005年6月的帐单金额(新台币)
BILL_AMT5:2005年5月的对帐单金额(新台币)
BILL_AMT6:2005年4月的帐单金额(新台币)
PAY_AMT1:2005年9月的先前付款金额(新台币)
PAY_AMT2:2005年8月的先前付款金额(新台币)
PAY_AMT3:2005年7月的先前付款金额(新台币)
PAY_AMT4:2005年6月的先前付款金额(新台币)
PAY_AMT5:2005年5月的先前付款金额(新台币)
PAY_AMT6:2005年4月的先前付款金额(新台币)
default.payment.next.month:默认付款(1 =是,0 =否)
SAS 环境:SAS STUDIO大学版
首先对数据进行数据描述,得到大致的数据概况。然后对缺失值处理
然后对数据进行归一化,这里用到的是STUDIO 的标准化模块
使用任务模块的二元逻辑回归
导入相应的预测值,分类变量,以及归一化完的数值连续变量
使用了默认的建模参数
然后输出模型结果:
模型信息 | |
---|---|
数据集 | WORK.STDIZE |
响应变量 | default_payment_next_month |
响应水平数 | 2 |
模型 | 二元 Logit |
优化方法 | Fisher 评分法 |
读取的观测数 | 30000 |
---|---|
使用的观测数 | 30000 |
响应概略 | ||
---|---|---|
有序 值 |
default_payment_next_month | 总 频数 |
1 | 0 | 23364 |
2 | 1 | 6636 |
建模的概率为 default_payment_next_month='1'。
分类水平信息 | ||||||||
---|---|---|---|---|---|---|---|---|
分类 | 值 | 设计变量 | ||||||
SEX | 1 | 1 | 0 | |||||
2 | 0 | 1 | ||||||
EDUCATION | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | |
2 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | |
3 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | |
4 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | |
5 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | |
6 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | |
MARRIAGE | 0 | 1 | 0 | 0 | 0 | |||
1 | 0 | 1 | 0 | 0 | ||||
2 | 0 | 0 | 1 | 0 | ||||
3 | 0 | 0 | 0 | 1 |
模型收敛状态 |
---|
满足收敛准则 (GCONV=1E-8)。 |
模型拟合统计量 | ||
---|---|---|
准则 | 仅截距 | 截距和协变量 |
AIC | 31707.354 | 27889.258 |
SC | 31715.663 | 28146.835 |
-2 Log L | 31705.354 | 27827.258 |
检验全局原假设: BETA=0 | |||
---|---|---|---|
检验 | 卡方 | 自由度 | Pr > 卡方 |
似然比 | 3878.0967 | 30 | <.0001 |
评分 | 3749.8174 | 30 | <.0001 |
Wald | 3061.8299 | 30 | <.0001 |
3 型效应分析 | |||
---|---|---|---|
效应 | 自由度 | Wald 卡方 |
Pr > 卡方 |
SEX | 1 | 13.4141 | 0.0002 |
EDUCATION | 6 | 41.4162 | <.0001 |
MARRIAGE | 3 | 35.5147 | <.0001 |
Standardized_PAY_0 | 1 | 1063.4129 | <.0001 |
Standardized_PAY_2 | 1 | 16.2970 | <.0001 |
Standardized_PAY_3 | 1 | 9.9461 | 0.0016 |
Standardized_PAY_4 | 1 | 0.8093 | 0.3683 |
Standardized_PAY_5 | 1 | 1.6349 | 0.2010 |
Standardized_PAY_6 | 1 | 0.0968 | 0.7557 |
Standardized_BILL_AM | 1 | 23.4764 | <.0001 |
Standardized_BILL_AM | 1 | 2.5703 | 0.1089 |
Standardized_BILL_AM | 1 | 1.0333 | 0.3094 |
Standardized_BILL_AM | 1 | 0.0108 | 0.9172 |
Standardized_BILL_AM | 1 | 0.2491 | 0.6177 |
Standardized_BILL_AM | 1 | 0.0267 | 0.8701 |
Standardized_PAY_AMT | 1 | 35.0031 | <.0001 |
Standardized_PAY_AMT | 1 | 20.6781 | <.0001 |
Standardized_PAY_AMT | 1 | 2.3634 | 0.1242 |
Standardized_PAY_AMT | 1 | 5.1893 | 0.0227 |
Standardized_PAY_AMT | 1 | 3.2759 | 0.0703 |
Standardized_PAY_AMT | 1 | 2.6011 | 0.1068 |
AGE | 1 | 8.3249 | 0.0039 |
LIMIT_BAL | 1 | 19.6728 | <.0001 |
最大似然估计分析 | ||||||
---|---|---|---|---|---|---|
参数 | 自由度 | 估计 | 标准 误差 |
Wald 卡方 |
Pr > 卡方 | |
Intercept | 1 | -1.7913 | 0.4332 | 17.0983 | <.0001 | |
SEX | 1 | 1 | 0.1125 | 0.0307 | 13.4141 | 0.0002 |
SEX | 2 | 0 | 0 | . | . | . |
EDUCATION | 0 | 1 | -9.5675 | 85.2395 | 0.0126 | 0.9106 |
EDUCATION | 1 | 1 | 0.3025 | 0.4035 | 0.5619 | 0.4535 |
EDUCATION | 2 | 1 | 0.2179 | 0.4031 | 0.2924 | 0.5887 |
EDUCATION | 3 | 1 | 0.1961 | 0.4038 | 0.2358 | 0.6273 |
EDUCATION | 4 | 1 | -0.8448 | 0.5642 | 2.2418 | 0.1343 |
EDUCATION | 5 | 1 | -1.0607 | 0.4747 | 4.9925 | 0.0255 |
EDUCATION | 6 | 0 | 0 | . | . | . |
MARRIAGE | 0 | 1 | -1.2406 | 0.5329 | 5.4196 | 0.0199 |
MARRIAGE | 1 | 1 | 0.0788 | 0.1373 | 0.3288 | 0.5664 |
MARRIAGE | 2 | 1 | -0.1102 | 0.1388 | 0.6301 | 0.4273 |
MARRIAGE | 3 | 0 | 0 | . | . | . |
Standardized_PAY_0 | 1 | 0.6491 | 0.0199 | 1063.4129 | <.0001 | |
Standardized_PAY_2 | 1 | 0.0976 | 0.0242 | 16.2970 | <.0001 | |
Standardized_PAY_3 | 1 | 0.0854 | 0.0271 | 9.9461 | 0.0016 | |
Standardized_PAY_4 | 1 | 0.0263 | 0.0292 | 0.8093 | 0.3683 | |
Standardized_PAY_5 | 1 | 0.0390 | 0.0305 | 1.6349 | 0.2010 | |
Standardized_PAY_6 | 1 | 0.00793 | 0.0255 | 0.0968 | 0.7557 | |
Standardized_BILL_AM | 1 | -0.4060 | 0.0838 | 23.4764 | <.0001 | |
Standardized_BILL_AM | 1 | 0.1717 | 0.1071 | 2.5703 | 0.1089 | |
Standardized_BILL_AM | 1 | 0.0933 | 0.0918 | 1.0333 | 0.3094 | |
Standardized_BILL_AM | 1 | -0.00904 | 0.0869 | 0.0108 | 0.9172 | |
Standardized_BILL_AM | 1 | 0.0461 | 0.0925 | 0.2491 | 0.6177 | |
Standardized_BILL_AM | 1 | 0.0116 | 0.0711 | 0.0267 | 0.8701 | |
Standardized_PAY_AMT | 1 | -0.2260 | 0.0382 | 35.0031 | <.0001 | |
Standardized_PAY_AMT | 1 | -0.2187 | 0.0481 | 20.6781 | <.0001 | |
Standardized_PAY_AMT | 1 | -0.0465 | 0.0302 | 2.3634 | 0.1242 | |
Standardized_PAY_AMT | 1 | -0.0637 | 0.0280 | 5.1893 | 0.0227 | |
Standardized_PAY_AMT | 1 | -0.0491 | 0.0271 | 3.2759 | 0.0703 | |
Standardized_PAY_AMT | 1 | -0.0372 | 0.0231 | 2.6011 | 0.1068 | |
AGE | 1 | 0.00537 | 0.00186 | 8.3249 | 0.0039 | |
LIMIT_BAL | 1 | -7E-7 | 1.578E-7 | 19.6728 | <.0001 |
优比估计 | |||
---|---|---|---|
效应 | 点估计 | 95% Wald 置信限 |
|
SEX 2-1 | 1.119 | 1.054 | 1.189 |
EDUCATION 6-0 | <0.001 | <0.001 | >999.999 |
EDUCATION 6-1 | 1.353 | 0.614 | 2.985 |
EDUCATION 6-2 | 1.244 | 0.564 | 2.740 |
EDUCATION 6-3 | 1.217 | 0.551 | 2.684 |
EDUCATION 6-4 | 0.430 | 0.142 | 1.298 |
EDUCATION 6-5 | 0.346 | 0.137 | 0.878 |
MARRIAGE 3-0 | 0.289 | 0.102 | 0.822 |
MARRIAGE 3-1 | 1.082 | 0.827 | 1.416 |
MARRIAGE 3-2 | 0.896 | 0.682 | 1.176 |
Standardized_PAY_0 | 1.914 | 1.841 | 1.990 |
Standardized_PAY_2 | 1.103 | 1.052 | 1.156 |
Standardized_PAY_3 | 1.089 | 1.033 | 1.148 |
Standardized_PAY_4 | 1.027 | 0.969 | 1.087 |
Standardized_PAY_5 | 1.040 | 0.979 | 1.104 |
Standardized_PAY_6 | 1.008 | 0.959 | 1.060 |
Standardized_BILL_AM | 0.666 | 0.565 | 0.785 |
Standardized_BILL_AM | 1.187 | 0.963 | 1.465 |
Standardized_BILL_AM | 1.098 | 0.917 | 1.314 |
Standardized_BILL_AM | 0.991 | 0.836 | 1.175 |
Standardized_BILL_AM | 1.047 | 0.874 | 1.255 |
Standardized_BILL_AM | 1.012 | 0.880 | 1.163 |
Standardized_PAY_AMT | 0.798 | 0.740 | 0.860 |
Standardized_PAY_AMT | 0.804 | 0.731 | 0.883 |
Standardized_PAY_AMT | 0.955 | 0.900 | 1.013 |
Standardized_PAY_AMT | 0.938 | 0.888 | 0.991 |
Standardized_PAY_AMT | 0.952 | 0.903 | 1.004 |
Standardized_PAY_AMT | 0.963 | 0.921 | 1.008 |
AGE | 1.005 | 1.002 | 1.009 |
LIMIT_BAL | 1.000 | 1.000 | 1.000 |
预测概率和观测响应的关联 | |||
---|---|---|---|
一致部分所占百分比 | 72.6 | Somers D | 0.452 |
不一致部分所占百分比 | 27.4 | Gamma | 0.452 |
结值百分比 | 0.0 | Tau-a | 0.156 |
对 | 155043504 | c | 0.726 |