原创 特徵工程之技術特徵與likelihood特徵
對於 categorical 特徵,我們有時需要對它作一些統計,得到統計特徵。 一種方式是對特徵計數,統計feature value 出現的次數,或在某個類下的出現次數。這樣可以當數值特徵用,也可以必要的時候把不同的次數當做獨立的特徵(比
原创 基於window10系統的docker+auto-sklearn環境搭建記錄
整理了一下以前打比賽時在自己筆記本上嘗試搭建auto-sklearn的過程,給大家一個參考~ 筆者在公司實習訓練模型時簡單地使用了一下docker,當時就覺得十分方便,簡單來說有4點: 1.模塊化,有一個配置好了程序運行環境docker意
原创 攢機記錄
作爲一名偏軟件方向的程序員,打算在畢業之前跟着室友好好學習一下攢機,以後硬件更新換代的時候也好自己捯飭,下面推薦給大家有趣的裝機UP主教程,性能測試軟件,文末還有電影動漫迷軟件推薦。 攢一臺主機,購買的基礎部件包括:機箱,主板,CPU,顯
原创 單機爬蟲簡單demo(附github鏈接)
這篇博文將介紹一下我的這個單機爬蟲作品,主要是給大家一個思路,如何做出一個比較有趣的單機爬蟲,當然這個作品肯定會有很多改進的地方,歡迎大家提出建議。(注:代碼僅供學習參考,須在法律允許範圍內使用) github: https://
原创 lgb貝葉斯調優
參考代碼: from bayes_opt import BayesianOptimization # 定義黑盒函數deflgb_cv(n_estimators,learning_rate,max_depth,num_leaves,mi
原创 數據挖掘/算法相關資源(工具)整理貼_1.0
工欲善其事必先利其器,這裏有一些不錯的學習資源或者工具給對AI感興趣的小夥伴: 科研相關 https://sci-hub.tw/ 在學校外面訪問不了學校圖書館論文庫資源時,搜SCI之類的外文文獻可以用這個 https://arxiv
原创 算法提案覆盤
入職培訓需要給公司產品提出一些算法方案來對產品進行優化。根據作業反饋向前輩們請教了一些問題,收穫良多,在這篇文章中總結一下當需要針對產品提出算法方案時,方案中需要具備的一些比較通用的考量因素。 主要從功能,價值,可行性,必要性,數據,流程
原创 基於springMVC+myBatis的web報名系統(附github鏈接)
github鏈接: https://github.com/colabin/Registration-system 項目簡介 當初這個系統是本科時學院舉辦的比賽時做的一個系統,也是自己學習web開發時練手的一個項目,算是一箇中規中矩的項目吧