原创 使用 python pandas的坑

1 dataframe 1.1 使用字典創建df的時候,如果字典的key只有一個value會報錯: dict_data = {"a":1, "b":2, "c":3} df = pd.DataFrame.from_dict(dic

原创 win10安裝jupyter notebook詳細步驟

1、安裝:我電腦裏python2.7和Python3.4都安裝了,在用pip安裝jupyter的時候,要指明安裝的是哪一版。在cmd中輸入。 cmd -python27 -m pip install jupyter noteboo

原创 決策樹系列(二):隨機森林(random forest)

隨機森林,屬於集成算法bagging的一種,關於什麼是bagging看這裏 決策樹系列(一):集成學習(ensemble learning)->boosting與bagging的區別 1、簡單原理以及特點 1)隨機森林,屬於集成算法b

原创 決策樹系列(一):集成學習(ensemble learning)->boosting與bagging的區別

我們在學習決策樹、隨機森林、GBDT等等算法的時候,會遇到這樣一個單詞ensemble learning:集成學習。前幾種算法都屬於集成學習的範疇。 下面來簡單介紹一下,經常使用到的集成學習策略,集成學習下有兩個重要的算法策略Bagg

原创 決策樹系列(二):GBDT-梯度提升決策樹-算法原理以及步驟

1 GBDT簡介 GBDT,英文全稱是Gradient Boosting Decision Tree,梯度提升決策樹,顧名思義,與梯度、boosting算法、決策樹有關。是一種迭代的決策樹算法,由多棵決策樹組成,每一顆決策樹也叫做基學

原创 決策樹系列(一):CART-分類迴歸樹-建模步驟以及代碼

1 CART,又名分類迴歸樹 有以下特點: (1)CART是一棵二叉樹; (2)CART既能是分類樹,又能是迴歸樹,由目標任務決定; (3)當CART是分類樹時,採用GINI值作爲結點分裂的依據;當CART是迴歸樹時,採用MSE(均方

原创 PCA:詳細解釋主成分分析

1 PCA目的/作用 主成分分析算法(PCA)是最常用的線性降維方法,它的目標是通過某種線性投影,將高維的數據映射到低維的空間中,並期望在所投影的維度上數據的信息量最大(方差最大),以此使用較少的數據維度,同時保留住較多的原數據點的特性。

原创 faster-rcnn 原理解析

這個筆記只寫了一部分,並不完全,我會抓緊時間寫完它。 以下都是本人的個人見解與總結,不妥之處歡迎指正。 (一)anchor的作用 Q1:爲什麼不直接回歸bbox的座標,要用anchor來輔助? A:因爲自然圖片中物體的大小是在幾個

原创 用自己的數據訓練Faster-RCNN,tensorflow版本(二)

我用的Faster-RCNN是tensorflow版本,fork自githubFaster-RCNN_TF 參考博客http://www.cnblogs.com/CarryPotMan/p/5390336.html 在用自己的數據訓練F

原创 Faster-RCNN Tensorflow版本源碼解析(二)train_net.py所用到的函數

這裏將要解析的是Faster-RCNN Tensorflow版本,fork自githubFaster-RCNN_TF。 1. 背景交代 Faster-RCNN_TF中,網絡的訓練文件是 Faster-RCNN_TF/tools/train

原创 Faster-RCNN Tensorflow版本源碼解析(一):網絡訓練部分train_net.py

這裏將要解析的是Faster-RCNN Tensorflow版本,fork自githubFaster-RCNN_TF。 網絡訓練部分 Faster-RCNN_TF中,網絡的訓練文件是 Faster-RCNN_TF/tools/train_

原创 用自己的數據訓練Faster-RCNN,tensorflow版本(一)

我用的Faster-RCNN是tensorflow版本,fork自githubFaster-RCNN_TF 參考 http://www.cnblogs.com/CarryPotMan/p/5390336.html 1、按照Faster-

原创 邏輯迴歸

以下內容,大家不要看,這些只是我的一些臨時感悟,暫時記錄在這裏。 邏輯迴歸(Logistic Regression) 假設有這樣一個場景,我要對一些用戶進行營銷,然後根據這些用戶的信息,看他們是否會對營銷有響應。這些用戶就叫做樣本,每一個

原创 決策樹(二):隨機森林(random forest)

隨機森林,屬於集成算法bagging的一種,關於什麼是bagging看這裏決策樹(一)集成學習 (ensemble learning)–boosting與bagging的區別 1、簡單原理以及特點 1)隨機森林,屬於集成算法bagging

原创 基於虛擬環境的TensorFlow安裝 on Mac OS X

基於虛擬環境的TensorFlow安裝 on Mac OS X TensorFlow官網上建議使用virtualenv(虛擬環境)安裝。 Virtualenv是與其他Python開發隔離的虛擬Python環境,不會在同一臺機器上干擾或受到