台部落鹤鹤有明

原文：https://blog.csdn.net/lilyth_lilyth/article/details/48032119 1、背景 CTR預估（Click-Through Rate Prediction）是互聯網計算廣

2018-09-19 03:20:24

無意間在網易雲課堂上找了一個Kaggle案例，泰坦尼克獲救船員預測，在此之前我是從沒接觸過kaggle，畢竟是剛入門的小白，看着視頻，算是真正實戰了一次，主要是在這個過程中學到了很多東西。下面視頻地址 http://study.163

2018-09-17 07:54:35

loc：通過選取行（列）標籤索引數據 iloc：通過選取行（列）位置編號索引數據 ix：既可以通過行（列）標籤索引數據，也可以通過行（列）位置編號索引數據 df是一個dataframe，列名爲A B C D 具體值如下： A

2018-09-17 07:54:35

第一步：系統中文字體查看 [hadoop@p168 ~]$ fc-list :lang=zh /System/Library/Fonts/STHeiti Medium.ttc: 黑體\-簡,黑體\-簡,Heiti SC,黒體\-簡,Hei

2018-09-17 07:54:35

目錄 1 使用sklearn進行數據挖掘　　1.1 數據挖掘的步驟　　1.2 數據初貌　　1.3 關鍵技術 2 並行處理　　2.1 整體並行處理　　2.2 部分並行處理 3 流水線處理 4 自動化調參 5 持久化 6 回顧 7

2018-09-06 20:43:22

目錄 1 特徵工程是什麼？ 2 數據預處理　　2.1 無量綱化　　　　2.1.1 標準化　　　　2.1.2 區間縮放法　　　　2.1.3 標準化與歸一化的區別　　2.2 對定量特徵二值化　　2.3 對定性特徵啞編碼　　2.4

2018-09-06 20:43:22

主元分析也就是PCA，主要用於數據降維。 1 什麼是降維？比如說有如下的房價數據：這種一維數據可以直接放在實數軸上：不過數據還需要處理下，假設房價樣本用表示，那麼均值爲：然後以均值爲原點：

2018-09-04 04:59:50

線性代數 https://www.matongxue.com/courses/1/ 微積分 https://www.matongxue.com/courses/2/ 馬同學高等數學如何理解主元分析（PCA）？ https://w

2018-09-04 04:59:50

原文 https://mp.weixin.qq.com/s/oqnb8yv0bJ__OLpcBSvtVg 主元分析也就是PCA，主要用於數據降維。1 什麼是降維？比如說有如下的房價數據：這種一維數據可以直接放在實數軸上：

2018-09-04 04:59:50

原文 https://blog.csdn.net/tiankong_/article/details/78332666 1.什麼是聯合概率分佈？聯合概率分佈簡稱聯合分佈，是兩個及以上隨機變量組成的隨機向量的概率分佈。根據隨機變量的不

2018-09-04 04:59:50

概率論文基本知識 https://blog.csdn.net/u012566895/article/details/51220127

2018-09-04 04:59:50

在概率統計理論中，如果變量序列或者其他隨機變量有相同的概率分佈，並且互相獨立，那麼這些隨機變量是獨立同分布。(independent and identically distributed ) 　　隨機變量X1和X2獨立,是

2018-09-04 04:59:50

stacking的過程有一張圖非常經典，如下：雖然他很直觀，但是沒有語言描述確實很難搞懂。上半部分是用一個基礎模型進行5折交叉驗證，如：用XGBoost作爲基礎模型Model1，5折交叉驗證就是先拿出四折作爲training d

2018-08-22 07:47:13

傳統GBDT以CART作爲基分類器，xgboost還支持線性分類器，這個時候xgboost相當於帶L1和L2正則化項的邏輯斯蒂迴歸（分類問題）或者線性迴歸（迴歸問題）。傳統GBDT在優化時只用到一階導數信息，xgboost則對代價函數進行

2018-08-22 07:47:13

二叉樹：樹中每個節點至多有兩個子節點二叉搜索樹：對於樹中任何節點，如果其左子節點不爲空，那麼該節點的value值永遠 >= 其左子節點；如果其右子節點不爲空，那麼該節點的value值永遠 <= 其右子節點（左子節點<value<右子節點）

2018-08-22 07:46:55