台部落东写西读1

想象一下，假如今天是你作爲數據分析師入職的第一天，老闆交給你一個數據分析任務：通過公司已經有的信用卡用戶和交易信息，預測用戶未來是否會逾期還款。這個問題看似簡單，實則隱藏了一個非常大的坑：據粗略估計，全國的信用卡平均不良率只有

2020-02-21 14:10:50

一、原理本文是處理樣本不均衡的第三種方法。思路也很簡單：從樣本量比較多的類別中隨機抽取一定數量的樣本，與樣本量比較小的類別組合在一塊兒訓練模型。這樣會訓練出好幾個模型，最後在應用時，使用組合的方法（例如投票、加權投票等）產生分

2020-02-21 14:10:50

決策樹算法在工業中本身應用並不多，但是，目前主流的比賽中的王者，包括GBDT、XGBOOST、LGBM都是以決策樹爲積木搭建出來的，所以理解決策樹，是學習這些算法的基石，今天，我們就從模型調用到調參詳細說說決策樹的使用方法。一

2020-02-21 14:10:40

入職之後公司裏發了電腦，跟隨自己闖蕩多年的電腦就賦閒在家了。有時候在公司小小地摸個魚寫的jupyternotebook文件，想要回家用自己的電腦接着寫，但是文件同步是一個大問題。爲了不天天揹着重重的書包擠地鐵，決定探索一下兩臺電

2019-10-26 12:42:21

一、pandas的兩大數據類型 Series：一維數組，與Numpy中的一維array類似。二者與Python基本的數據結構List也很相近，其區別是：List中的元素可以是不同的數據類型，而Array和Series中則只允許存儲相同

2019-09-10 11:20:00

在使用openpose這個人體姿態檢測程序過程中，用到了一個C++包，但是在windows系統下需要利用swig組件編譯一下纔可以使用，但是windows下比較坑的一點就是編譯工具不完善，在使用swig的過程中老是報錯：error

2019-07-30 10:15:11

偶然用到了swig這個工具，這篇文章寫的很好，轉載一下，鏈接： https://www.jianshu.com/p/a257e630fe42

2019-07-30 10:15:11

https://www.jianshu.com/p/9b677a053e6e

2019-07-30 10:15:11

lintcode（8）題目：給定一個字符串和一個偏移量，根據偏移量旋轉字符串(從左向右旋轉)。樣例對於字符串 “abcdefg”. offset=0 => “abcdefg” offset=1 => “gabcdef”

2019-07-05 10:34:01

1、前言以前在做深度學習項目的時候常常使用TensorFlow框架，但是明顯感覺到，TensorFlow1.X版本在運行深度學習程序之前需要進行建立計算圖、會話等操作，對於快速入門和嘗試自己的小想法來說是一個不小的麻煩。就好比你

2019-06-12 02:48:49

前言：最近在編寫一個前端界面的時候用到了很多PyQt5的控件，發現這些控件使用起來很簡單：只要首先知道每個控件都是什麼樣子，能夠完成什麼功能，然後導入對應的控件包，一句函數就可以直接生成，最後查查每個控件的方法和事件列表，進行符合自

2019-05-11 17:43:09

閒來無事，邊理解PR曲線和ROC曲線，邊寫了一下計算兩個指標的代碼。在python環境下，sklearn裏有現成的函數計算ROC曲線座標點，這裏爲了深入理解這兩個指標，寫代碼的時候只用到numpy包。事實證明，實踐是檢驗真理的唯一標準

2019-05-07 04:23:45

第一步準備參考文獻首先，新建一個後綴名爲.bib的文件，準備放置參考文獻。（可以新建一個.txt文件並更改後綴名）。參考文獻可以從google學術上直接導出，比如，我需要引用一篇mask-Rcnn相關的論文，在谷歌學術裏搜索。找

2019-04-26 02:31:57

使用Latex寫論文，最大的優點主要有兩個：1）可以利用代碼方便地編輯公式；2）插入圖表、公式不需要自己費心思排版，可以避免word插入圖片的各種格式問題，另外也可以像word一樣，無需手動對圖表和公式編號。第一個優點自不必說，我們平

2019-04-22 01:36:33

前言：這篇論文是2013年11月發表在CVPR上的，當時正值卷積神經網絡在計算機視覺任務中初放光彩。17年剛剛接觸深度學習的時候看過這篇論文，當時也是在組會上講過。以下就是大概的講解思路。但是當時看這篇論文沒有太大的感覺，覺得這篇論

2019-04-19 10:50:35