原创 Vintage、滾動率、遷移率的應用

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》BY 小石頭一、Vintage      Vintage源於葡萄酒釀造,葡萄酒的品質會因葡萄生長的年份不同、氣候不同而不同。Vintage分析是指評估不同年份的葡萄酒的品質隨

原创 python生成隨機數

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 在實現算法時經常會用到隨機數,有時會忘記各種隨機數的生成方法,這裏對Python中的隨機數生成方法進行彙總,以供以後查閱。 import numpy as np # 兩者實

原创 非平衡數據的處理方法

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 在分類問題中常常遇到一個比較頭疼的問題,即目標變量的類別存在較大偏差的非平衡問題。這樣會導致預測結果偏向多類別,因爲多類別在損失函數中所佔權重更大,偏向多類別可以使損失函數

原创 DataFrame和Series的排序

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 ################################### 排序 ######################################## from p

原创 非平衡數據的處理方法

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 在分類問題中常常遇到一個比較頭疼的問題,即目標變量的類別存在較大偏差的非平衡問題。這樣會導致預測結果偏向多類別,因爲多類別在損失函數中所佔權重更大,偏向多類別可以使損失函數

原创 python生成隨機數

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 在實現算法時經常會用到隨機數,有時會忘記各種隨機數的生成方法,這裏對Python中的隨機數生成方法進行彙總,以供以後查閱。 import numpy as np # 兩者實

原创 R語言計算IV值及使用

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 在對變量分箱後,需要計算變量的重要性,IV是評估變量區分度或重要性的統計量之一,R語言計算IV值的代碼如下: CalcIV <- function(df_bin, key_

原创 R語言繪製KS曲線

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》將代碼封裝在函數PlotKS_N裏,Pred_Var是預測結果,可以是評分或概率形式;labels_Var是好壞標籤,取值爲1或0,1代表壞客戶,0代表好客戶;descend

原创 Python計算KS值並繪製KS曲線

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 python實現KS曲線,相關使用方法請參考上篇博客-R語言實現KS曲線 代碼如下: ####################### PlotKS ############

原创 python計算IV值及使用

更多風控建模、大數據分析等內容請關注公衆號《大數據風控的一點一滴》 在對變量分箱後,需要計算變量的重要性,IV是評估變量區分度或重要性的統計量之一,python計算IV值的代碼如下: def CalcIV(Xvar, Yvar):