台部落IMWTJ

一、基於密度的聚類 K-Means 算法、K-Means++ 算法和Mean Shift 算法都是基於距離的聚類算法，當數據集中的聚類結果是球狀結構時，能夠得到比較好的結果，但當數據集中的聚類結果是非球狀的結構時，基於距離的聚類算法的聚

2019-04-04 16:12:03

一、 Mean Shift 算法 K-Means 算法最終的聚類效果受初始的聚類中心的影響，K-Means++ 算法未選擇較好的初始聚類中心提供了依據，但在 K-Means 算法中，聚類的類別個數 k 仍需要事先指定。對於類別個數未知

2019-04-03 16:05:42

聚類一、聚類任務在無監督的學習中，訓練樣本的標記信息是未知的，目標是通過對無標記訓練樣本的學習來揭露數據的內在性質及規律，爲進一步的數據的分析提供基礎，此類學習任務中研究最多、應用最廣泛的是聚類。聚類試圖將數據集中的樣本劃分爲若干個

2019-03-28 01:01:15

線性迴歸存在問題：在處理複雜的迴歸問題時，普通的線性迴歸問題會出現預測精度不夠的問題，如果模型中特徵之間有較強的相關關係時，即特徵之間出現嚴重的多重共線性時，用普通最小二乘法估計模型參數，往往參數估計的方差太大，求出來的模型就很

2019-03-25 00:50:15

以前用spyder都挺好的，今天發現打不開，只有任務欄有圖標，點擊沒有反應。解決方法：刪除：C:\用戶\Administrator裏面的.spyder-py3和.matplotlib文件然後啓動spyder，就好了

2019-03-25 00:50:15

至此分類算法在前面都學完了，下面將進行迴歸算法的學習。迴歸算法和分類算法都屬於監督學習算法，不同的是分類算法中標籤的是一些離散的值，代表不同的類別，而在迴歸算法中，標籤是一些連續的值，迴歸算法需要訓練得到樣本特徵到這些連續標籤之間的映射

2019-03-22 16:10:26

一、神經元模型神經網絡：目前使用最廣泛的定義是由適應性的簡單單元組成的廣泛並行互連的網絡，它的組織能夠模擬生物神經系統對真實世界物體所做出的交互反應。我們在機器學習中談論神經網絡時指的是神經網絡學習，或者說，是機器學習與神經網絡這兩個

2019-03-20 16:06:28

上一節說過隨機森林（Random Forest,RF）算法是一種重要的基於Bagging 的集成學習算法，它可以用來做分類、迴歸等問題。下面就分類問題展開學習。一、隨機森林算法模型 RF 在以決策樹爲基學習器構建 Bagging 集成

2019-03-15 00:11:18

隨機森林算法是一種重要的基於 Bagging 的集成學習方法，可用來做分類、迴歸等問題。隨機森林算法是由一系列的決策樹組成，他通過自助法（Bootstrap）重採樣技術，從原始訓練樣本集中有放回的重複隨機抽取 m 個樣本，生成新的訓練樣本

2019-03-14 15:28:50

147