原创 機器學習超詳細實踐攻略(21):三板斧幹掉樣本不均衡問題之1——過(欠)採樣

想象一下,假如今天是你作爲數據分析師入職的第一天,老闆交給你一個數據分析任務:通過公司已經有的信用卡用戶和交易信息,預測用戶未來是否會逾期還款。 這個問題看似簡單,實則隱藏了一個非常大的坑:據粗略估計,全國的信用卡平均不良率只有

原创 機器學習超詳細實踐攻略(23):三板斧幹掉樣本不均衡問題之3——通過集成學習方法解決樣本不均衡

一、原理 本文是處理樣本不均衡的第三種方法。思路也很簡單:從樣本量比較多的類別中隨機抽取一定數量的樣本,與樣本量比較小的類別組合在一塊兒訓練模型。這樣會訓練出好幾個模型,最後在應用時,使用組合的方法(例如投票、加權投票等)產生分

原创 機器學習超詳細實踐攻略(9):手把手帶你使用決策樹算法與調參

決策樹算法在工業中本身應用並不多,但是,目前主流的比賽中的王者,包括GBDT、XGBOOST、LGBM都是以決策樹爲積木搭建出來的,所以理解決策樹,是學習這些算法的基石,今天,我們就從模型調用到調參詳細說說決策樹的使用方法。 一

原创 利用Git構建雲服務器實現多臺電腦同步工作

入職之後公司裏發了電腦,跟隨自己闖蕩多年的電腦就賦閒在家了。有時候在公司小小地摸個魚寫的jupyternotebook文件,想要回家用自己的電腦接着寫,但是文件同步是一個大問題。爲了不天天揹着重重的書包擠地鐵,決定探索一下兩臺電

原创 入門Pandas數據分析,這篇文章就夠了

  一、pandas的兩大數據類型 Series:一維數組,與Numpy中的一維array類似。二者與Python基本的數據結構List也很相近,其區別是:List中的元素可以是不同的數據類型,而Array和Series中則只允許存儲相同

原创 在安裝Python包的時候報錯:error: Unable to find vcvarsall.bat的解決辦法

在使用openpose這個人體姿態檢測程序過程中,用到了一個C++包,但是在windows系統下需要利用swig組件編譯一下纔可以使用,但是windows下比較坑的一點就是編譯工具不完善,在使用swig的過程中老是報錯:error

原创 Windows平臺下Python使用swig調用C++

偶然用到了swig這個工具,這篇文章寫的很好,轉載一下,鏈接: https://www.jianshu.com/p/a257e630fe42

原创 親測可用的一種加速下載github項目的方法

https://www.jianshu.com/p/9b677a053e6e

原创 用python手刃Lintcode(一)

lintcode(8) 題目: 給定一個字符串和一個偏移量,根據偏移量旋轉字符串(從左向右旋轉)。 樣例 對於字符串 “abcdefg”. offset=0 => “abcdefg” offset=1 => “gabcdef”

原创 Pytorch從0到1系列之(0)---安裝Pytorch

1、前言 以前在做深度學習項目的時候常常使用TensorFlow框架,但是明顯感覺到,TensorFlow1.X版本在運行深度學習程序之前需要進行建立計算圖、會話等操作,對於快速入門和嘗試自己的小想法來說是一個不小的麻煩。就好比你

原创 一些PyQt5相關控件的彙總博客

前言:最近在編寫一個前端界面的時候用到了很多PyQt5的控件,發現這些控件使用起來很簡單:只要首先知道每個控件都是什麼樣子,能夠完成什麼功能,然後導入對應的控件包,一句函數就可以直接生成,最後查查每個控件的方法和事件列表,進行符合自

原创 利用Python中的numpy包實現PR曲線和ROC曲線的計算

閒來無事,邊理解PR曲線和ROC曲線,邊寫了一下計算兩個指標的代碼。在python環境下,sklearn裏有現成的函數計算ROC曲線座標點,這裏爲了深入理解這兩個指標,寫代碼的時候只用到numpy包。事實證明,實踐是檢驗真理的唯一標準

原创 Latex利用bibtex引用參考文獻的方法。

第一步 準備參考文獻 首先,新建一個後綴名爲.bib的文件,準備放置參考文獻。(可以新建一個.txt文件並更改後綴名)。 參考文獻可以從google學術上直接導出,比如,我需要引用一篇mask-Rcnn相關的論文,在谷歌學術裏搜索。找

原创 用Latex寫論文時如何簡單方便地插入圖片、表格和公式

使用Latex寫論文,最大的優點主要有兩個:1)可以利用代碼方便地編輯公式;2)插入圖表、公式不需要自己費心思排版,可以避免word插入圖片的各種格式問題,另外也可以像word一樣,無需手動對圖表和公式編號。第一個優點自不必說,我們平

原创 Visual Convolutional Neural Network論文關鍵點

前言:這篇論文是2013年11月發表在CVPR上的,當時正值卷積神經網絡在計算機視覺任務中初放光彩。17年剛剛接觸深度學習的時候看過這篇論文,當時也是在組會上講過。以下就是大概的講解思路。但是當時看這篇論文沒有太大的感覺,覺得這篇論