台部落Marina-ju

原文鏈接：https://mp.csdn.net/mdeditor/100581001 參考：https://stackoverflow.com/questions/25192794/n

2019-09-08 09:42:36

原文鏈接：http://www.statsmodels.org/devel/generated/statsmodels.tsa.stattools.adfuller.html 一在py

2019-09-03 09:41:23

原文鏈接：https://mp.csdn.net/mdeditor/100397994 1.ravel: 2.flatten: 3.reshape:

2019-09-03 09:41:23

1.WOE Weight of Evidence,證據權重。要對一個變量進行WOE編碼，需要首先把這個變量進行分組處理（離散化，分箱等）。分組後，對於第i組，這個組中響應客戶站樣本中所有響應客戶的比例爲pyip_{yi}pyi

2019-08-06 09:31:31

《Factorization Machines》paper的閱讀筆記，僅爲了整理個人思路。個人覺得FM的本質就是預測值=偏置+權重1單變量+權重2變量之間的相互作用。偏置和權重都可以是標量，也可以是向量下面是本人認爲重要的文

2019-08-03 10:00:31

https://machinelearningmastery.com/check-point-deep-learning-models-keras/

2019-07-30 09:30:01

import tensorflow as tf #創建數據流圖：y = Wx + b,其中，W和B爲存儲節點，x爲數據節點 x = tf.placeholder(tf.float32) W = tf.Variable(1.0) b

2019-07-30 09:30:00

1.https://blog.csdn.net/willduan1/article/details/78070086 2.https://blog.csdn.net/weixin_37352167/article/details/

2019-07-30 09:30:00

raw 數據——>能被學習的數據的過程：特徵工程分類：離散的輸出空間迴歸：連續的輸出空間線性分類器： D維的空間映射到K維的空間的空間，W=W*D維向量的點積：其物理意義是計算兩個變量之間的相關度和相似性 softmax:

2019-07-11 11:46:42

同質集成：基學習器異質集成：組建學習器 Boosting：串行學習，bias比較小 Bagging：並行學習，variance比較小 stacking：投票方法是學出來的，學：其實就是迭代，糾錯，遞歸，集成學習一 wide（

2019-07-11 11:46:42

文本預處理流水線: Python的NLTK庫介紹和使用 NLTK：官網地址：http://www.nltk.org/ Python上註明的自然語言處理庫，具有如下優點：自帶語料庫，詞性分類庫自帶分類，分

2019-07-06 10:58:50

1.數值型數據幅度縮放（最大最小值縮放，歸一化…）離散化／分箱分桶（等距：pd.cut，等頻：pd.qcut）（特徵交叉）統計值（Max，min,quentile）四則運算（加減乘除）幅度變化（有一些模型對輸入數據有分

2019-07-05 09:51:46

目標：argminxf(x)arg min_{x} f(x)argminxf(x),其中，g(x)=∇f(x),H(x)=∇∇f(x)g(x)=\nabla f(x), H(x)=\nabla \nabla f(x)g(x)=∇

2019-07-05 09:51:46

循環神經網絡 RNN :循環神經網絡，處理的是後續的輸出與之前的內容有關聯的任務。 RNN引入“記憶”的概念 “循環”2字來源於其每個源於都執行相同的任務，但是輸出依賴於輸入和“記憶”。NMT: neural m

2019-07-05 09:51:46

一卷積神經網絡層級結構保持了層級網絡結構不同層次有不同形式（運算）與功能主要是以下層次：數據輸入層/input layer 三種常見的數據處理方式去均值：把輸入數據各個維度都中心化到0 歸一化：幅度歸一化到同樣的範圍

2019-07-03 10:23:05