原创 數據挖掘參考資源

參考資源: 理論部分: 特徵工程怎麼做 通過一個kaggle實例學習解決機器學習問題 實踐部分: 使用sklearn做特徵工程 使用sklearn優雅的進行數據挖掘 使用Python進行描述性統計 數據探索:藉助圖表或者總結性的數值來

原创 RandomForest調參,不斷總結

class sklearn.ensemble.RandomForestClassifier(n_estimators: int 默認10criter

原创 七種重要的模型驗證錯誤矩陣

預測模型的類型: 1.分類模型:分類問題中有兩類算法                       (1)類別輸出:比如SVM,KNN等                       (2)概率輸出:LR,random forest,Grad

原创 wide & deep論文-----2016.6.24

摘要 具有非線性特徵變換的廣義線性模型被廣泛應用於具有稀疏輸入的大規模迴歸和分類問題。 通過廣泛的跨產品特性轉換,特徵交互記憶是有效的和可解釋的。 然而泛化性能要求更多的特徵工程。 基於少量的特徵工程,通過對稀疏特徵轉換爲低維密

原创 Ubuntu MySQL python

安裝MySQL sudo apt-get update sudo apt-get install mysql-server mysql-client pip install MySQL-python 若出現錯誤:Environme

原创 【機器學習詳解】SMO算法剖析

轉載請註明出處:http://blog.csdn.net/luoshixian099/article/details/51227754 CSDN−勿在浮沙築高臺 本文力求簡化SMO的算法思想,畢竟自己理解有限,無奈還是要拿一堆公

原创 【總結】Python 2.x中常見字符編碼和解碼方面的錯誤及其解決辦法

轉載自:在路上 » 【總結】Python 2.x中常見字符編碼和解碼方面的錯誤及其解決辦法 點擊打開鏈接 Python 2.x中的字符編碼,設計的的確不好,導致初學者,甚至是即使用Python很長時間的人,都會經常遇到字符編解碼方面的

原创 做推薦系統 細節記錄

1.groupby 之後的對象轉換爲Dataframe    object.reset_index() 2.替換指定數值 df.A = df.A.map({'F': '000', 'S': '001'})3.DataFrame.to_d

原创 python用於數據科學教程

此博文是對原文的一個理解和知識點整理(個人理解可能有誤),只是方便以後快速查閱。不是對原文的完全翻譯,原文詳細鏈接點擊打開鏈接 一:python數據分析基礎 二:python庫和數據結構 三:pandas用於數據探索 (1)導入庫 (2)

原创 在線最優化算法梳理

文章參考自:在線最優化求解-馮楊 目的 從已有數據中提煉出最適合的模型參數,從而對位置的數據進行預測。當數據是高維高數據量的時候,常見的批處理方式已經顯的力不從心。 個人理解:因爲當數據批輸入的時候,高數據量使得計算速度很慢,特

原创 caffe源碼學習中--src/caffe/solver.cpp

include/caffe/solver_factory.hpp中的solverRegistry類和SolverRegisterer 類 /**  * @brief A solver factory that allows one to

原创 淺談數據挖掘與機器學習

        <div class="markdown_views"><h1 id="引言"><a name="t0" target="_blank"></a>引言</h1> <p>在大多數非計算機專業人士以及部分計算機專業背景人士眼

原创 小白安裝caffe、py-faster-rcnn艱難歷程

安裝anaconda: 下載:https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/ bash anaconda.....sh enteryes.. 測試 :anaco

原创 How can we identify the weights of different models for ensemble?

One of the most common challenge with ensemble modeling is to find optimal weights to ensemble base models. In general,

原创 pandas 常用方法

1.布爾篩選 data.loc[(data['a'] ==a1)&(data ['B'] ==b1),['A','B']] 2.data.apply ( func, axis=0) #axis=0 defines that functio