原创 python基礎之第一個python腳本

第一個python腳本 文件的創建 文件創建注意事項 文件擴展名爲 .py 內容第一行通過註釋的方式聲明當前腳本的字符集,保存時必須以utf-8的編碼格式保存(在保存的左邊有一個編碼類型,選擇utf-8) # coding:

原创 數據分析--時間問題與降維

數據降維降低預測時間 使用自帶的數字模型,查看使用KNN算法和邏輯迴歸算法的分類時間,並降低數據維度縮短預測時間 一般處理速度問題的幾個方面 1. 數據量太大 (抽樣) 2. 樣本特徵太多 (降維) 3. 樣本的量級太大(歸

原创 K均值算法(K-means)聚類

主要知識點 K-means算法 KMeans(n_clusters=3) K-means的中心點 centers = kmeans.cluster_centers_ 座標軸中文顯示問題 座標軸字體、負號還原問題 3D繪圖 from

原创 數據處理--圖片像素點聚類

一、壓縮圖片原理 壓縮圖片 顏色是256(0-255)種顏色 從中抽取16(4*4)種顏色 然後將圖片上的所有顏色向這16種顏色上去靠 在保存的時候會將這16中顏色抽取出來 保存時圖片就會被壓縮。 1) 2) 3) 二、加載圖片

原创 數據處理--圖片壓縮

一、壓縮圖片原理 壓縮圖片 顏色是256(0-255)種顏色 從中抽取16(4*4)種顏色 然後將圖片上的所有顏色向這16種顏色上去靠 在保存的時候會將這16中顏色抽取出來 保存時圖片就會被壓縮。 1) 2) 3) 二、加載圖片

原创 Python基礎--文件操作(OS)

一、操作方式 1)讀 注意:光標會以文本開始讀取 1、以文本讀取讀 1、絕對路徑讀取 f = open('/home/pyrookie/temp.txt',mode='r',encoding='utf-8') content = f.re

原创 數據分析--模型選擇流程

分析小麥數據時的模型選擇 一、模型總結 1)分類問題 1、knn 缺點: 時間複雜度 空間複雜度高 優點: 實現簡單,易於理解 總結:適合樣本最小,分類邊界不明顯的情況 2、邏輯迴歸 優點: 分類時計算量非常小,速度很快,存

原创 Python基礎--深淺拷貝

python中的copy 一、變量傳遞 l1 = [1,2,3] l2 = l1 l1.append('a') print(l1,id(l1)) print(l2,id(l2)) [1, 2, 3, 'a'] 1397980388870

原创 Python基礎--集合

集合 集合是可變的數據類型 元素必須是不可變的數據類型 特徵: 無序、不重複 一、創建 1)正確方式 set1 = set({1,2,3,4}) print(set1) 2)錯誤方式 set2 = {1,2,3,[2,3],{'na

原创 Python高級--支持向量機SVM

一、支持向量機原理 1)支持向量機基本概念 Support Vector Machine 支持向量機,其含義是通過支持向量運算的分類器。 其中“機”的意思是機器,可以理解爲分類器。 那麼什麼是支持向量呢?在求解的過程中,會發現只根據部分

原创 Python基礎--字典的操作

一、數據類型劃分 1)不可變數據類型 不可變數據類型又稱不可哈希 - 字符串 - 布爾值 - 數字 - 元祖 2)可變數據類型 可變數據類型又稱可哈希 - 列表 - 字典 - 集合 字典的key必須是不

原创 Python高級--樸素貝葉斯

一、貝葉斯 1)貝葉斯原理 公式中,事件Bi的概率爲P(Bi),事件Bi已發生條件下事件A的概率爲P(A│Bi),事件A發生條件下事件Bi的概率爲P(Bi│A)。 2)貝葉斯解決的問題 實例一: 我們想預測北京的冬天某一天下雪,當

原创 K近鄰值(KNN)小麥種類預測 預測年收入是否大於50K美元 癌症預測

知識點梳理: 小麥種類預測: 打亂分離集和結果集,源碼辦法 年收入預測: 樣本字符串轉數字 癌症預測: 打亂分離集和結果集自帶函數,樣本數據歸一化 文章中數據下載 一、小麥種類預測 1)處理數據 1、導入數據 sampl

原创 Python高級--K-近鄰算法(KNN)

文中數據下載 K nearest neighbour K-近鄰算法採用測量不同特徵值之間的距離方法進行分類。 優點:精度高、對異常值不敏感、無數據輸入假定。 缺點:時間複雜度高、空間複雜度高。 適用數據範圍:數值

原创 Python高級--matplotlib畫圖

Matplotlib官方文檔 一、Matplotlib基礎 下面的測試數據下載 Matplotlib中的基本圖表包括的元素 1) x軸和y軸 axis 水平和垂直的軸線 2)軸標籤 axisLabel 水平和垂直的軸標籤 3)x軸