原创 深度神經網絡(Deep Neural Network, DNN)

線性模型通過特徵間的現行組合來表達“結果-特徵集合”之間的對應關係。由於線性模型的表達能力有限,在實踐中,只能通過增加“特徵計算”的複雜度來優化模型。比如,在廣告CTR預估應用中,除了“標題長度、描述長度、位次、廣告id,cookie“

原创 信用評分之七--邏輯迴歸中的虛擬變量設置

虛擬變量定義   在實際建模過程中,被解釋變量不但受定量變量影響,同時還受定性變量影響。例如需要考慮性別、民族、不同歷史時期、季節差異、企業所有制性質不同等因素的影響。這些因素也應該包括在模型中。   由於定性變量通常表示的是某種特

原创 機器學習——隨機森林算法及原理

1. 隨機森林使用背景 1.1 隨機森林定義 隨機森林是一種比較新的機器學習模型。經典的機器學習模型是神經網絡,有半個多世紀的歷史了。神經網絡預測精確,但是計算量很大。上世紀八十年代Breiman等人發明分類樹的算法(Breiman

原创 信用評分之二--信用評分中的評分卡中的A卡、B卡和C卡

A卡(Application score card)申請評分卡 B卡(Behavior score card)行爲評分卡 C卡(Collection score card)催收評分卡 評分機制的區別在於: 1.使用的時間不同。分別側重