原创 DBSCAN 算法及 Python 實現

 一、基於密度的聚類 K-Means 算法、K-Means++ 算法和Mean Shift 算法都是基於距離的聚類算法,當數據集中的聚類結果是球狀結構時,能夠得到比較好的結果,但當數據集中的聚類結果是非球狀的結構時,基於距離的聚類算法的聚

原创 Mean Shift 算法原理及 Python 實現

 一、 Mean Shift 算法  K-Means 算法最終的聚類效果受初始的聚類中心的影響,K-Means++ 算法未選擇較好的初始聚類中心提供了依據,但在 K-Means 算法中,聚類的類別個數 k 仍需要事先指定。對於類別個數未知

原创 聚類算法——K-Means

聚類 一、聚類任務 在無監督的學習中,訓練樣本的標記信息是未知的,目標是通過對無標記訓練樣本的學習來揭露數據的內在性質及規律,爲進一步的數據的分析提供基礎,此類學習任務中研究最多、應用最廣泛的是聚類。 聚類試圖將數據集中的樣本劃分爲若干個

原创 嶺迴歸和Lasso 迴歸

線性迴歸存在問題:     在處理複雜的迴歸問題時,普通的線性迴歸問題會出現預測精度不夠的問題,如果模型中特徵之間有較強的相關關係時,即特徵之間出現嚴重的多重共線性時,用普通最小二乘法估計模型參數,往往參數估計的方差太大,求出來的模型就很

原创 spyder突然打不開

以前用spyder都挺好的,今天發現打不開,只有任務欄有圖標,點擊沒有反應。 解決方法: 刪除:C:\用戶\Administrator裏面的.spyder-py3和.matplotlib文件 然後啓動spyder,就好了  

原创 線新迴歸的原理及實踐(牛頓法)

至此分類算法在前面都學完了,下面將進行迴歸算法的學習。 迴歸算法和分類算法都屬於監督學習算法,不同的是分類算法中標籤的是一些離散的值,代表不同的類別,而在迴歸算法中,標籤是一些連續的值,迴歸算法需要訓練得到樣本特徵到這些連續標籤之間的映射

原创 BP神經網絡原理及實踐

一、神經元模型 神經網絡: 目前使用最廣泛的定義是由適應性的簡單單元組成的廣泛並行互連的網絡,它的組織能夠模擬生物神經系統對真實世界物體所做出的交互反應。我們在機器學習中談論神經網絡時指的是神經網絡學習,或者說,是機器學習與神經網絡這兩個

原创 隨機森林 RF 算法原理及實踐(二)

 上一節說過隨機森林(Random Forest,RF)算法是一種重要的基於Bagging 的集成學習算法,它可以用來做分類、迴歸等問題。下面就分類問題展開學習。 一、隨機森林算法模型 RF 在以決策樹爲基學習器構建 Bagging 集成

原创 隨機森林 RF 算法的原理(一)

隨機森林算法是一種重要的基於 Bagging 的集成學習方法,可用來做分類、迴歸等問題。隨機森林算法是由一系列的決策樹組成,他通過自助法(Bootstrap)重採樣技術,從原始訓練樣本集中有放回的重複隨機抽取 m 個樣本,生成新的訓練樣本

原创 錯誤: No module named 'cPickle'

 導入模塊 import cPickle as pickle 運行程序時發現出現錯誤:   ImportError: No module named 'cPickle' 其實是版本的問題,python3並不兼容ython2 因爲在p

原创 TypeError: write() argument must be str, not bytes

運行程序時出現下面的錯誤: TypeError: write() argument must be str, not bytes 其實是文件打開的問題,而且默認的儲存方式是二進制 原始程序是: with open(result_

原创 windows10系統安裝JDK

1.JDK 的下載 http://www.oracle.com/technetwork/java/javase/downloads/index.html 出現下面的界面並點擊圖中指示圖標: 點擊選擇 Accept License Agr

原创 安裝 JAVA 的開發工具 Eclipse

1.安裝Eclipse的開發工具 點擊下面鏈接 https://www.eclipse.org/downloads/,點擊 Download Packages 如下圖所示: 按照自己電腦版本選擇下載,我是64位,如下圖所示:   2

原创 支持向量機SVM原理及實踐(二)

 四、序列最小優化算法 SMO 1. 核函數: 前面我們瞭解的 SVM 是線性的支持向量機,當我們遇到非線性可分的數據集時並找不到分隔超平面,可以引入核函數,將非線性問題轉化爲線性問題。核函數是通過將數據映射到高維空間,來解決在原始空間中

原创 支持向量機SVM原理及實踐(一)

 一、什麼是支持向量機 SVM  支持向量機( Support Vector Mavhine )簡稱 SVM ,是一種二類分類模型。SVM 的目標是找到一個超平面,然後找到各個分類離這個超平面最近的樣本點,使得這個點到超平面的距離最大化,