原创 自己實現的簡易的knn算法
程序代碼: import csv import random import operator import math import matplotlib.pyplot as plt #計算距離的函數 def getdistance(tes
原创 支持向量機svm的完整實現並配有解析
svm分析(類似於源碼) from future import print_functionfrom time import timeimport logging#繪圖工具import matplotlib.pyplot as plt#cr
原创 機器學習之微積分與概率論入門1
這兩門學科作爲機器學習的必備科目! 一、微積分1夾逼定理通俗的講:A≤B≤C當求極限時,存在A=C,則說明B也等於A和C案例1: 案例2: 2 兩個重要極限 3 導數通俗的講就是曲線的斜率二階導數是斜率變化快慢的反應,表徵曲線的凹凸性常用的
原创 決策樹入門程序,各部分配有解析
from sklearn.feature_extraction import DictVectorizer import csv from sklearn import tree from sklearn import preprocess
原创 python之畫三維圖像
一:利用的包:(1)構建三維對象:mpl_toolkits.mplot3d裏面導入Axes3D(2)數據方面操作:numpy(3)繪圖工具包:matplotlib.pyplot 二:繪圖:1、繪圖主要分成兩種情況:(1)一種是根據函數來繪製
原创 關於一維和多維數組切片問題的總結
切片問題對於初學者剛開始是有點難,因爲沒記住,容易混。其實對於切片操作,只要弄清楚本質,其實它並不難。 切片本質:就是通過分割(二維中好比橫豎線,其他類似),得到矩陣數據(二維中好比一個被分割的方塊,其他類似)的部分數據 逗號是用來區分維
原创 解決sklearn中利用fetch_lfw_people下載數據的問題
*初始代碼: import sklearn.datasets import fetchlfwpeoplefaces=fetchlfwpeople()* 使用時,由於數據量大,可能途中因爲網絡或者其他原因出現問題 解決方法:
原创 reshape函數的用法
一、作用:常使用在對矩陣的處理上 二、函數特點:reshape函數是針對對目標函數取數據用於重新佈局時,是按照列的方式來獲取數據的 三、幾種常見使用方式: 方式一:arr.reshape((m,n))意思是把arr矩陣變成一個新的m行n列的
原创 python之隨機數生成方法彙總
python裏面生成隨機數的方法主要集中在numpy模塊的random子模塊中:import numpy as np(1)生成一個隨機浮點數,範圍是0-1:np.random.random()(2)生成指定範圍內的隨機浮點數:np.rand
原创 決策樹問題一:讀取文件頭報錯問題 has no attribute next
這個是版本的問題引起的,在2.7版本中應該使用代碼如下: allElectronicsData = open(r'AllElectronics.csv', 'rb') reader = csv.reader(allElectronicsDa
原创 一個完整的爬蟲入門程序
直接先說準備工作:(1)清楚爬蟲工作的流程: 向頁面發出請求---------獲取請求文件---------處理請求文件--------抽取自己想要的內容 (2)要用到的函數與庫主要是requests庫: 負責去向頁面發出請求beautiS
原创 frexp函數簡介
這個函數存在於math模塊中:主要作用是返回一個關於參數x的二元組傳入參數x ,那麼存在x=m(2的n次方):返回值爲(m,n)