原创 機器學習(5)-- 支持向量機 SVM(一)

1. 支持向量機的基本原理 線性可區分 SVM -> support vector machine 考慮如下分類問題: 可以看到,黑色和白色的點分別爲兩類,那麼可以在平面找一條線,將兩種點分割在直線的兩端,如圖的藍色和紅色的直

原创 機器學習(4)-- KNN算法應用

KNN模型調用 在sklearn包中封裝了KNN的模型。可以直接傳入數據集進行調用 本文使用數據集 iris ,分別調用了sklearn的knn模塊和自己編寫的knn模塊分析了結果,下面給出代碼 knn調用 def iris_

原创 機器學習(3)-- KNN算法

KNN算法 KNN算法是一種常見的分類算法,其名稱來源於 k Nearest neighbors,該算法基本思想爲,對於一個分類問題,新的數據的類別應該和離他最近的已知數據點的類別相同。 KNN算法不同於常見的統計算法。是一種懶

原创 機器學習(2)- 決策樹應用

安裝包 使用python 模塊scikit-learn 覆蓋問題領域: 分類(classification), 迴歸(regression), 聚類(clustering), 降維(dimensionality reduction

原创 機器學習(1)--決策樹

決策樹 決策樹可以理解爲對於條件的一系列判定,由於每一個條件都有是否兩種情況,將所有情況按照樹狀組織起來就叫做決策樹。決策樹可以對於數據集上的數據做分類。如下圖 節點中代表當前的數據各自的佔比,根節點代表play的數據有9個,n

原创 深度學習之基礎-概率和信息論

第三章 概率和信息論 3.13 信息論 量化信息需要滿足的性質: 非常可能發生的事件信息量要比較少,並且極端情況下,確保能夠發生的事件 應該沒有信息量。 較不可能發生的事件具有更高的信息量。 獨立事件應具有增量的信息。例如

原创 深度學習之基礎-線性代數

第二章 線性代數 2.4 線性相關 書裏面給的現行相關的例子不是很明瞭,百科給出的現行相關定義 設α₁,α₂,…,αₑ(e≥1)是域P上線性空間V中的有限個向量.若V中向量α可以表示爲:α=k₁α₁+k₂α₂+…+kₑαₑ(kₑ∈P,

原创 python學習筆記之爬蟲-3-初識scrapy

scrapy scrapy是一個成熟的爬蟲框架,可以有邏輯的組織大量的爬蟲進行高效的爬取數據和持久化,scrapy可以分爲以下幾個模塊: 引擎(Scrapy) 用來處理整個系統的數據流處理, 觸發事務(框架核心) 調度器(S

原创 python學習筆記之爬蟲 -1- 初識爬蟲

爬蟲 python爬蟲識一個對於網絡資源進行批處理的程序,比方說,現在我想要看汽車之家的最新新聞的合集,或者說我自己做了一個程序,想要臨時擴充一下目前的資訊庫,需要轉載其他人的文章,手動的轉贊無疑是非常慢的,這裏就可以用到爬蟲,下面給

原创 python學習筆記之基礎操作(八)模塊和包-2- json,xml,time,sys,os模塊

time模塊 常用三種模式來表示時間,分別爲 時間戳 通常來說,時間戳表示的是從1970年1月1日00:00:00開始按秒計算的偏移量。我們運行“type(time.time())”,返回的是float類型。 字符串 結構體

原创 python學習筆記之爬蟲 -2-拉取github工程列表

需求 在命令行登錄github,獲取其賬號下的倉庫列表和相關信息 分析 就這個爬蟲來看,其編碼過程應該是這樣的,第一步是分析網頁,因爲這裏涉及到登錄的問題,所以需要去登錄頁面查看其登錄操作都發送了那些數據,使用什麼來認證你的登錄行爲,

原创 python學習筆記之基礎操作(八)模塊和包-1-基本概念

模塊 通常來說,一個.py文件就叫做一個模塊,可以直接利用不帶.py的方式將一個py文件當做模塊引入,之後,引入的模塊就以變量的形式存在於當前文件下,可以通過.的方式直接引用其中的方法等。例如: #main.py import tes

原创 python學習筆記之基礎操作(九)類 -2- 繼承

繼承 繼承是面向對象的語言中很重要的一個特性,可以進一步增加代碼的重用性和整個代碼邏輯的順暢性。python中的繼承類似於java,C++中的繼承,子類會繼承父類的方法和屬性,在python中,屬性不需要聲明,因此不像java中會遇到

原创 python學習筆記之基礎操作(九)類 -1- 聲明和初始化

聲明 此處不再記錄面向對象編程的相關基本思維,只涉及python具體語法 在python中,類的聲明格式如下: class Dog: color = 0 age = 1 home = "peking" def __init__

原创 python學習筆記之基礎操作(八)模塊和包-3- re模塊

re模塊 re模塊用於python中的正則匹配,處理簡單的字符串函數無法處理的模糊匹配和複雜匹配 re模塊主要分爲兩部分,第一部分是正則規則,主要包含一些特殊字符,第二部分是re模塊下的函數,主要是搜索,分割等等函數 正則規則 元字符