原创 使用Keras實現多輸出分類:用單個模型同時執行兩個獨立分類任務

選自pyimagesearch,作者:Adrian Rosebrock,機器之心編譯,參與:Panda。 如何讓一個網絡同時分類一張圖像的兩個獨立標籤?多輸出分類可能是你的答案。已經推出了兩個圖像搜索引擎(ID My Pill 和 Chi

原创 Python3入門機器學習 - 邏輯迴歸與決策邊界

logistic迴歸又稱logistic迴歸分析,是一種廣義的線性迴歸分析模型,以胃癌病情分析爲例,選擇兩組人羣,一組是胃癌組,一組是非胃癌組,兩組人羣必定具有不同的體徵與生活方式等。因此因變量就爲是否胃癌,值爲“是”或“否”,自變量就

原创 Python3入門機器學習 - 決策樹

信息熵   左式的信息熵較高,代表左式的不確定性更強,左式即指數據有三個類別,每個類別佔1/3   右式的信息熵爲0,是信息熵可以達到的最小值,代表數據的不確定性最低,即最確定   繪製決策樹的決策邊界 import numpy

原创 Python3入門機器學習 - k近鄰算法

鄰近算法,或者說K最近鄰(kNN,k-NearestNeighbor)分類算法是數據挖掘分類技術中最簡單的方法之一。所謂K最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。 kNN算法的核心思想是如果一個

原创 Python3入門機器學習 - 集成學習

集成學習是使用一系列學習器進行學習,並使用某種規則把各個學習結果進行整合從而獲得比單個學習器更好的學習效果的一種機器學習方法。 #準備數據 X,y = datasets.make_moons(noise=0.3,n_samples=

原创 Python3入門機器學習 - 支撐向量機SVM

SVM的主要思想可以概括爲兩點: 它是針對線性可分情況進行分析,對於線性不可分的情況,通過使用非線性映射算法將低維輸入空間線性不可分的樣本轉化爲高維特徵空間使其線性可分,從而使得高維特徵空間採用線性算法對樣本的非線性特徵進行線性分析成爲

原创 解析天池大賽O2O第一名 extract_feature.py 提取特徵

讀取數據 dataset split: (date_received) dateset3: 20160701~20160731 (113640),features3 from 20160315~20160630 (off_test) d

原创 Python3入門機器學習 - 模型泛化

模型正則化 在多項式迴歸中如果degree過大,會造成過擬合的情況,導致模型預測方差極大,因此,我們可以使用模型正則化的方式來減小過擬合導致的預測方差極大的問題   即在我們訓練模型時,不僅僅需要將預測的y和訓練集的y的均方誤差

原创 Python3入門機器學習 - 混淆矩陣、精準率、召回率

在分類問題中,預測準確度如果簡單的用預測成功的概率來代表的話,有時候即使得到了99.9%的準確率,也不一定說明模型和算法就是好的,例如癌症問題,假如癌症的發病率只有0.01%,那麼如果算法始終給出不得病的預測結果,也能達到很高的準確率

原创 Python3入門機器學習 - 線性迴歸與knn算法處理boston數據集

簡單線性迴歸 最小二乘法實現原理 使用最小二乘法計算a、b的值,實現線性迴歸的擬合 # _*_ encoding:utf-8 _*_ import numpy as np class SimpleLinearRegression1:

原创 RESTful API

1. RESTful架構風格 RESTful架構風格最初由Roy T. Fielding(HTTP/1.1協議專家組負責人)在其2000年的博士學位論文中提出。HTTP就是該架構風格的一個典型應用。從其誕生之日開始,它就因其可擴展性和簡單

原创 Python3入門機器學習 - 多項式迴歸與學習曲線

非線性方程的擬合,例如 y=x^2+0.5x+1 , 就是將x^2看作X的一個特徵值 #準備數據 import numpy as np import matplotlib.pyplot as plt x = np.random.u

原创 Python3入門機器學習 - PCA(主成分分析)

主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化爲少數幾個綜合指標(即主成分),其中每個主成分都能夠反映原始變量的大部分信息,且所含信息互不重複。這種方法在引進多方面變量的同時將複雜因素歸結爲幾個主成分,使問題簡單化,同時得到

原创 Python3入門機器學習 - 梯度下降法

梯度下降是迭代法的一種,可以用於求解最小二乘問題(線性和非線性都可以)。在求解機器學習算法的模型參數,即無約束優化問題時,梯度下降(Gradient Descent)是最常採用的方法之一,另一種常用的方法是最小二乘法。在求解損失函數的最

原创 Python3入門機器學習 - Jupyter Notebook篇

我們搭建及其學習所需要的環境,可以使用名爲ACACONDA的集成工具來進行一鍵安裝,在Acaconda的官網下載安裝後,可以得到   Machine Learning 更改工作路徑 使用ANACONDA安裝的Jupyter NoteB