原创 baidu接口使用

1、如何使用百度接口 https://ai.baidu.com/tech/nlp/dnnlm_cn 應用列表中–》創建應用—>會生成一個新創建的應用,生成AK,SK 二、調用接口的使用方法:

原创 adaboost、bagging、boosting的區別

Bagging和Boosting 概念及區別 Bagging和Boosting都是將已有的分類或迴歸算法通過一定方式組合起來,形成一個性能更加強大的分類器,更準確的說這是一種分類算法的組裝方法。即將弱分類器組裝成強分類器的方法。

原创 七種迴歸技術

什麼是迴歸分析? 迴歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。 例如,司機的魯莽駕駛與道路交通事故數量之間的關係,最好的研究方法就

原创 交叉驗證 Cross-validation

交叉驗證(CrossValidation)方法思想簡介 以下簡稱交叉驗證(Cross Validation)爲CV.CV是用來驗證分類器的性能一種統計分析方法,基本思想是把在某種意義下將原始數據(dataset)進行分組,一部分做爲訓

原创 給numpy矩陣添加一列

# coding=utf-8 from pandas import DataFrame import datetime import numpy as np import pandas as pd # The error metric

原创 python--數據清洗

1.數據錯誤: 錯誤類型 – 髒數據或錯誤數據 • 比如, Age = -2003 – 數據不正確 • ‘0’ 代表真實的0,還是代表缺失 – 數據不一致 • 比如收入單位是萬元,利潤單位是元,或者一個單位是 美元,一個是人民幣 –

原创 python中的list和array的不同之處

python中的list是python的內置數據類型,list中的數據類不必相同的,而array的中的類型必須全部相同。 在list中的數據類型保存的是數據的存放的地址,簡單的說就是指針,並非數據,這樣保存一個list就太麻煩了 例

原创 xgboost 調參經驗

1.xgboost 基本方法和默認參數 在訓練過程中主要用到兩個方法:xgboost.train()和xgboost.cv(). #xgboost.train()API xgboost.train(params,dtrain,nu

原创 sklearn分類器、數據集的劃分

https://www.cnblogs.com/hhh5460/p/5132203.html 大致可以將這些分類器分成兩類: 1)單一分類器,2)集成分類器 一、單一分類器 下面這個例子對一些單一分類器效果做了比較 # codin

原创 pandas 學習(一)

1、pandas 學習(一) —— read_csv ,read_excel對 DataFrame 對象迭代得到的是其各個屬性列的列名一、生成數據表 1、首先導入pandas庫,一般都會用到numpy庫,所以我們先導入備用:import

原创 Python下的機器學習工具scikit-learn --數據預處理

sklearn裏的predict proba返回值? 返回你測試集中每個測試樣例各分類的概率 eg: #測試樣例: X_test = [ [2,3,4,5] [3,4,5,6] ] #假設分類結果爲可能爲0,1兩類 model

原创 numpy np.repeat 與 np.tile的區別, numpy.ravel()函數

二者執行的是均是複製操作;np.repeat:複製的是多維數組的每一個元素;np.tile:複製的是多維數組本身; 1. np.repeat  tile() x = np.arange(1, 5).reshape(2, 2) print

原创 模型評價指標

一、分類評價指標 1、對數損失函數(Log-loss)   在分類輸出中,若輸出不再是0-1,而是實數值,即屬於每個類別的概率,那麼可以使用Log-loss對分類結果進行評價。這個輸出概率表示該記錄所屬的其對應的類別的置信度。比如如果

原创 pandas:填充缺失值 fillna("missing") 和fillna("missing",inplace=True)的區別

當數據中存在NaN缺失值時,我們可以用其他數值替代NaN,主要用到了DataFrame.fillna()方法,下面我們來看看具體的用法: 1.先來創建一個帶有缺失值的DataFrame: # coding=utf-8 import n

原创 解決:ImportError: No module named 'xxxx'-------python中關於import語句

我用的 python 3.5   1、解決方法如下: try: # for Python2 from Tkinter import * except ImportError: # for Python3