原创 ML算法基礎——分類算法(樸素貝葉斯)

文章目錄樸素貝葉斯算法1、概率基礎2、樸素貝葉斯介紹3.樸素貝葉斯算法案例3.1 sklearn樸素貝葉斯實現API3.2 sklearn-20類新聞分類3.3 樸素貝葉斯案例流程4.樸素貝葉斯分類特點總結 樸素貝葉斯算法 1、概

原创 ML算法基礎——分類算法-決策樹、隨機森林

文章目錄1.決策樹1.1 認識決策樹1.2 信息論基礎-銀行貸款分析1.2.1 信息論基礎-信息熵1.2.2 決策樹的劃分依據之一-信息增益1.3 泰坦尼克號乘客生存分類1.3.1 sklearn決策樹API1.3.2 泰坦尼克號

原创 ML算法基礎——分類模型評估與調參

文章目錄一、分類模型評估1.準確率2.精確率和召回率2.1 混淆矩陣2.2 精確率(Precision)與召回率(Recall)2.3 分類模型評估API2.4 貝葉斯模型評估實例二、模型的選擇與調優1、交叉驗證2、網格搜索2.1

原创 ML算法基礎——分類算法(k近鄰算法)

文章目錄1.k近鄰算法(KNN)概述2.sklearn k-近鄰算法API3.實例流程3.1 鳶尾花分類3.2 Facebook V: Predicting Check Ins | Kaggle4.k-近鄰算法優缺點 1.k近鄰算

原创 ML算法基礎——特徵工程(降維案例)

降維案例(Instacart Market Basket Analysis) 文章目錄降維案例(Instacart Market Basket Analysis)1.探究問題2.數據集的描述3.問題分析4.合併數據4.1 合併各張

原创 ML算法基礎——特徵工程(特徵處理、降維)

文章目錄1. 數據的特徵處理1.1 概述1.2 歸一化(MinMaxScaler語法)1.2.1 概述1.2.2 sklearn歸一化API(MinMaxScaler)1.3 標準化(StandardScaler語法)1.3.1

原创 ML算法基礎——概述、特徵工程(特徵抽取)

文章目錄1、機器學習概述2、數據來源與類型3、數據的特徵工程3.1 特徵工程概況3.2 scikit-learn庫介紹3.4 數據的特徵抽取3.4.1 特徵抽取實例演示3.4.2 sklearn特徵抽取API3.4.3 字典特徵抽

原创 數據科學包——pandas基礎(核心數據結構)

文章目錄一、Series1.創建1.1 從 ndaray 創建1.2 從字典創建1.3 從標量創建2.Series對象2. Series 是類 ndarray 對象2.2 Series 是類字典對象3.標籤對齊操作4.name屬性

原创 運行時出現錯誤AttributeError: 'NoneType' object has no attribute 'format'

運行時出現如下的報錯 import pandas as pd import numpy as np print("Missing required dependencies {values}").format(values =

原创 數據科學包——pandas基礎(整形、透視、時間序列、類別)

文章目錄一、數據整形(stack函數)二、數據透視表(pivot table)三、時間序列1.時間序列2.在不同的時間表達方式間轉換2.1 時間戳轉爲時期 to_period()函數2.2 時期轉爲時間戳 to_timestamp

原创 數據科學包——pandas基礎(處理丟失數據、統計、合併、分組)

文章目錄一、處理丟失數據1.爲空值數據賦值2.刪除空數據行和列3.填充所有缺失數據4.判斷是否有NaN值二、統計1.平均值、求和、累加和2.shift函數3.sub函數4.apply 應用函數5.計數和衆數三、數據合併1.conc

原创 數據科學包——pandas基礎(創建對象、查看和選擇數據)

文章目錄一、創建數據集對象1.Pandas數據結構Series1.1 普通初始化1.2 指定index1.3 利用字典構造Series1.4 numpy ndarray構建一個Series2.Pandas數據結構DataFrame

原创 數據科學包——初識numpy(索引、合併、拷貝)

文章目錄五、索引1.簡單索引1.1 一維數組1.2 二維數組2.數組作爲索引3.bool 索引4.廣播特性六、合併與分割1.合併1.1 vstack,hstack1.2 concatenate1.3 增加維度2.分割2.1 spl

原创 數據科學包——初識numpy(創建、屬性、運算)

文章目錄一、Numpy簡介二、numpy創建數組1.dtype定義格式2.定義矩陣三、numpy屬性1.創建一個數組2.查看數組維度3.查看數組類型4.查看數組元素個數四、numpy基礎運算1.數組的加減冪乘1.1 加減冪1.2

原创 Linux中的shell編程Ⅱ——位置參數、數組、date和cal

文章目錄一、位置參量1.簡介2.位置參量列表3.傳遞位置參數4.退出碼二、數組1.數組定義與初始化2.數組的引用與賦值3.試驗三、date和cal命令1.date 命令1.1 獲取時間1.2 格式化輸出1.3 利用date指令來取