原创 機器學習學習筆記 第二十章 聚類算法-DBSCAN

聚類算法-DBSCAN Density-Based Spatial Clustering of Applications with Noise 基本概念: 核心對象:若某個點的密度達到算法設定的閾值則其爲核心點。 相當於在r的

原创 【筆記】3、初學python3網絡爬蟲——urllib庫的使用

python3網絡爬蟲——urllib庫的使用 學習指引:視頻教程《python3網絡爬蟲實戰》 爲了避免學習後短時間內遺忘,讓自己隨時可以查閱前方自己學過的知識,特意註冊csdn博客,方便自己學習時做筆記,也方便隨時回顧。也希望

原创 機器學習學習筆記 第二十二章 主成分分析PCA算法

主成分分析(PCA) Principal Component Analysis 用途:降維中最常用的一種手段 目標:提取最有價值的信息(基於方差) 問題:降維後數據有什麼意義嗎? 描述 PCA(principal compone

原创 機器學習學習筆記 第十九章 聚類算法-K-MEANS

聚類算法 聚類的概念: 主要用來處理無監督問題,因爲我們手上沒有標籤了,靠電腦自己進行分類 聚類是指把相似的東西分到一組 難點 如何評估呢(因爲沒有了標籤,難以對比正確與否,很多評估方法失效了) 如何調參呢 K-MEANS的

原创 機器學習學習筆記 第二十章 聚類算法-

聚類算法-DBSCAN Density-Based Spatial Clustering of Applications with Noise 基本概念: 核心對象:若某個點的密度達到算法設定的閾值則其爲核心點。 相當於在r的鄰域

原创 機器學習學習筆記 第十七章 支持向量機

支持向量機(Support Vector Machine) 以前非常厲害的一個算法,不過後來遇到了對手——神經網絡 這個也是面試的時候經常會問到的非常重要的一個算法 SVM要解決的問題:什麼樣的決策邊界纔是最好的,如下圖中兩堆點怎麼

原创 機器學習學習筆記 第十五章 貝葉斯算法

貝葉斯算法 貝葉斯要解決的問題 正向概率 逆向概率 舉例:一個班級中,男生 60%,女生 40%,男生總是穿長褲,女生則一半穿長褲一半穿裙子 正向概率:隨機選取一個學生,他(她)穿長褲的概率和穿裙子的概率是多 逆向概率:迎面走來

原创 機器學習學習筆記 第十六章 基於貝葉斯的新聞分類

利用貝葉斯分類器進行文本分類 考慮情況 1 對於文本分析,首先我們應該先利用停用詞語料庫對部分大量出現的停用詞進行屏蔽,可以百度直接搜停用詞進行下載 我們對於經常出現的詞,有可能是一個不太重要的詞,比如《中國蜜蜂養殖》,其中中國出現

原创 機器學習學習筆記 第十八章 SVM調參並觀察

支持向量機(SVM) SVM調參 %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import stats impor

原创 【筆記】2、初學python3網絡爬蟲——爬蟲的基本原理

python3網絡爬蟲——爬蟲的基本原理 這是我的第二篇python3網絡爬蟲學習筆記 學習指引:視頻教程《python3網絡爬蟲實戰》 爲了避免學習後短時間內遺忘,讓自己隨時可以查閱前方自己學過的知識,特意註冊csdn博客,方便自己學習

原创 【筆記】5、初學python3網絡爬蟲——正則表達式的基本使用

python3網絡爬蟲——正則表達式的基本使用 學習指引:視頻教程《python3網絡爬蟲實戰》 爲了避免學習後短時間內遺忘,讓自己隨時可以查閱前方自己學過的知識,特意註冊csdn博客,方便自己學習時做筆記,也方便隨時回顧。也希望自己的學

原创 【筆記】4、初學python3網絡爬蟲——Requests庫的使用

python3網絡爬蟲——Requests庫的使用 學習指引:視頻教程《python3網絡爬蟲實戰》 爲了避免學習後短時間內遺忘,讓自己隨時可以查閱前方自己學過的知識,特意註冊csdn博客,方便自己學習時做筆記,也方便隨時回顧。也希望自己

原创 【筆記】1、初學python3網絡爬蟲——環境配置

python3網絡爬蟲——環境配置 學習指引:視頻教程《python3網絡爬蟲實戰》 爲了避免學習後短時間內遺忘,讓自己隨時可以查閱前方自己學過的知識,特意註冊csdn博客,方便自己學習時做筆記,也方便隨時回顧。也希望自己的學習過程能給同