原创 自己實現的簡易的knn算法

程序代碼: import csv import random import operator import math import matplotlib.pyplot as plt #計算距離的函數 def getdistance(tes

原创 支持向量機svm的完整實現並配有解析

svm分析(類似於源碼) from future import print_functionfrom time import timeimport logging#繪圖工具import matplotlib.pyplot as plt#cr

原创 機器學習之微積分與概率論入門1

這兩門學科作爲機器學習的必備科目! 一、微積分1夾逼定理通俗的講:A≤B≤C當求極限時,存在A=C,則說明B也等於A和C案例1: 案例2: 2 兩個重要極限 3 導數通俗的講就是曲線的斜率二階導數是斜率變化快慢的反應,表徵曲線的凹凸性常用的

原创 決策樹入門程序,各部分配有解析

from sklearn.feature_extraction import DictVectorizer import csv from sklearn import tree from sklearn import preprocess

原创 python之畫三維圖像

一:利用的包:(1)構建三維對象:mpl_toolkits.mplot3d裏面導入Axes3D(2)數據方面操作:numpy(3)繪圖工具包:matplotlib.pyplot 二:繪圖:1、繪圖主要分成兩種情況:(1)一種是根據函數來繪製

原创 關於一維和多維數組切片問題的總結

切片問題對於初學者剛開始是有點難,因爲沒記住,容易混。其實對於切片操作,只要弄清楚本質,其實它並不難。 切片本質:就是通過分割(二維中好比橫豎線,其他類似),得到矩陣數據(二維中好比一個被分割的方塊,其他類似)的部分數據 逗號是用來區分維

原创 解決sklearn中利用fetch_lfw_people下載數據的問題

*初始代碼: import sklearn.datasets import fetchlfwpeoplefaces=fetchlfwpeople()* 使用時,由於數據量大,可能途中因爲網絡或者其他原因出現問題 解決方法:

原创 reshape函數的用法

一、作用:常使用在對矩陣的處理上 二、函數特點:reshape函數是針對對目標函數取數據用於重新佈局時,是按照列的方式來獲取數據的 三、幾種常見使用方式: 方式一:arr.reshape((m,n))意思是把arr矩陣變成一個新的m行n列的

原创 python之隨機數生成方法彙總

python裏面生成隨機數的方法主要集中在numpy模塊的random子模塊中:import numpy as np(1)生成一個隨機浮點數,範圍是0-1:np.random.random()(2)生成指定範圍內的隨機浮點數:np.rand

原创 決策樹問題一:讀取文件頭報錯問題 has no attribute next

這個是版本的問題引起的,在2.7版本中應該使用代碼如下: allElectronicsData = open(r'AllElectronics.csv', 'rb') reader = csv.reader(allElectronicsDa

原创 一個完整的爬蟲入門程序

直接先說準備工作:(1)清楚爬蟲工作的流程: 向頁面發出請求---------獲取請求文件---------處理請求文件--------抽取自己想要的內容 (2)要用到的函數與庫主要是requests庫: 負責去向頁面發出請求beautiS

原创 frexp函數簡介

這個函數存在於math模塊中:主要作用是返回一個關於參數x的二元組傳入參數x ,那麼存在x=m(2的n次方):返回值爲(m,n)