原创 DataWhale一週算法進階3---模型融合

文章目錄一 任務二 代碼問題 一 任務 用你目前評分最高的模型作爲基準模型,和其他模型進行stacking融合,得到最終模型及評分果。 二 代碼 import pandas as pd import numpy as np impo

原创 DataWhale一週算法進階1---特徵工程(半成品。。繼續改進)

文章目錄一 任務二 特徵工程一 特徵工程二 特徵選擇三 特徵選擇——IV值四 特徵選擇——隨機森林三 代碼實現一 python IV值的實現 (代碼未調通)二 特徵選擇——隨機森林 代碼的實現四 問題Reference 一 任務 特徵

原创 DataWhale一週算法進階1---數據預處理(數據探索)

文章目錄一 任務二 數據探索一 數據中的變量二 數據預處理導包移除模型無關信息項和status將城市的漢字轉爲數字缺失值較多的student_feature的處理日期型特徵處理其他數值特徵的處理三 問題Reference 一 任務 數

原创 DataWhale一週算法實踐4---模型調優(五折交叉驗證實踐)

文章目錄一 本次任務二 k折交叉驗證&網格搜索法三 代碼實踐1.邏輯迴歸2.svm3.決策樹4.隨機森林5.GBDT6.XGBoost7.lightGBM四 參考五 思考1.GridSearchCV & cross_val_score

原创 DataWhale一週算法實踐3---模型評估(accuracy、precision,recall和F-measure、auc值)

文章目錄1 參數詳解1.1 accuracy1.2 precision1.3 recall1.4 F1-measure1.5 auc值&roc曲線 TODO2 基於本次項目對6個評分參數的理解3 對於7個模型的6個參數的計算3.1 邏

原创 DataWhale一週算法實踐2---模型構建((隨機森林、GBDT、XGBoost和LightGBM)

一 參考博客 構建隨機森林、GBDT、XGBoost和LightGBM這4個模型,評分方式任意。 https://blog.csdn.net/w952470866/article/details/78987265 隨機森林 ht

原创 DataWhale一週算法實踐--day01

背景 背景: 報名參加一週帶做算法實踐的小項目 數據: 數據是金融數據, 我們要做的是預測貸款用戶是否會逾期。 表格中, status是標籤: 0表示未逾期, 1表示逾期。 實驗 讀取數據 import pandas as pd

原创 百度滴滴京東實習生面試題

1. Linux接觸的多嗎?2. LInux和MySql的區別?3. 你的項目的前臺怎麼搭建的?4. Mysql涉及的事務簡單的介紹一下?5. 用過javascript,說一下你的輪播圖怎麼做的?6. 數據庫表的查詢有幾種方式,畫一下你的