獲取數據
數據可以是自己爬取,也可以是其它方式獲取,不多說。
數據的特徵提取和數據清洗
在SPSS Modeler 中導入數據並利用特徵模型對原數據進行特徵分析。
可以得出重要的字段和不重要的字段。
對136個重要字段進行數據審覈,可以看出字段有無缺失值、異常值,。。
~~
然後對數據根據個人需求進行數據清洗。
略
*
分析方法:連續變量分箱方法;logistics迴歸;評分卡方法。
*對字段進行分享計算WOE值
建立模型
導出模型方程爲TXT文本
**
導出迴歸係數**
根據之前導出的方程模型進行計算
將回歸係數轉化成信用評分
根據上一步得出的迴歸係數計算各分箱評分
信用模型檢驗
導出八萬條客戶的評分數據。
可以看出K-S值最大的是267分,說明如果267分以上放貸,以下不放,可以有拒絕49.592%的壞顧客,同時也會拒絕31.247%的好客戶。。
模型驗證示例
到此就結束,人懶,細節的地方就不寫了。因爲純屬是爲了學習,所以模型最後的結果不是很讓人滿意,但是大致上瞭解了SPSS Modeler 的操作。。