原创 特徵工程之技術特徵與likelihood特徵

對於 categorical 特徵,我們有時需要對它作一些統計,得到統計特徵。 一種方式是對特徵計數,統計feature value 出現的次數,或在某個類下的出現次數。這樣可以當數值特徵用,也可以必要的時候把不同的次數當做獨立的特徵(比

原创 基於window10系統的docker+auto-sklearn環境搭建記錄

整理了一下以前打比賽時在自己筆記本上嘗試搭建auto-sklearn的過程,給大家一個參考~ 筆者在公司實習訓練模型時簡單地使用了一下docker,當時就覺得十分方便,簡單來說有4點: 1.模塊化,有一個配置好了程序運行環境docker意

原创 攢機記錄

作爲一名偏軟件方向的程序員,打算在畢業之前跟着室友好好學習一下攢機,以後硬件更新換代的時候也好自己捯飭,下面推薦給大家有趣的裝機UP主教程,性能測試軟件,文末還有電影動漫迷軟件推薦。 攢一臺主機,購買的基礎部件包括:機箱,主板,CPU,顯

原创 單機爬蟲簡單demo(附github鏈接)

這篇博文將介紹一下我的這個單機爬蟲作品,主要是給大家一個思路,如何做出一個比較有趣的單機爬蟲,當然這個作品肯定會有很多改進的地方,歡迎大家提出建議。(注:代碼僅供學習參考,須在法律允許範圍內使用)     github: https://

原创 lgb貝葉斯調優

參考代碼: from bayes_opt import BayesianOptimization # 定義黑盒函數deflgb_cv(n_estimators,learning_rate,max_depth,num_leaves,mi

原创 數據挖掘/算法相關資源(工具)整理貼_1.0

工欲善其事必先利其器,這裏有一些不錯的學習資源或者工具給對AI感興趣的小夥伴:   科研相關  https://sci-hub.tw/ 在學校外面訪問不了學校圖書館論文庫資源時,搜SCI之類的外文文獻可以用這個 https://arxiv

原创 算法提案覆盤

入職培訓需要給公司產品提出一些算法方案來對產品進行優化。根據作業反饋向前輩們請教了一些問題,收穫良多,在這篇文章中總結一下當需要針對產品提出算法方案時,方案中需要具備的一些比較通用的考量因素。 主要從功能,價值,可行性,必要性,數據,流程

原创 基於springMVC+myBatis的web報名系統(附github鏈接)

github鏈接: https://github.com/colabin/Registration-system 項目簡介 當初這個系統是本科時學院舉辦的比賽時做的一個系統,也是自己學習web開發時練手的一個項目,算是一箇中規中矩的項目吧