原创 ML算法基礎——分類算法(k近鄰算法)

文章目錄1.k近鄰算法(KNN)概述2.sklearn k-近鄰算法API3.實例流程3.1 鳶尾花分類3.2 Facebook V: Predicting Check Ins | Kaggle4.k-近鄰算法優缺點1.k近鄰算法(KNN)

原创 ML算法基礎——特徵工程(降維案例)

降維案例(Instacart Market Basket Analysis)文章目錄降維案例(Instacart Market Basket Analysis)1.探究問題2.數據集的描述3.問題分析4.合併數據4.1 合併各張表到⼀張表當

原创 ML算法基礎——特徵工程(特徵處理、降維)

文章目錄1. 數據的特徵處理1.1 概述1.2 歸一化(MinMaxScaler語法)1.2.1 概述1.2.2 sklearn歸一化API(MinMaxScaler)1.3 標準化(StandardScaler語法)1.3.1 概述1.3

原创 ML算法基礎——概述、特徵工程(特徵抽取)

文章目錄1、機器學習概述2、數據來源與類型3、數據的特徵工程3.1 特徵工程概況3.2 scikit-learn庫介紹3.4 數據的特徵抽取3.4.1 特徵抽取實例演示3.4.2 sklearn特徵抽取API3.4.3 字典特徵抽取(特徵值

原创 數據科學包——pandas基礎(核心數據結構)

文章目錄一、Series1.創建1.1 從 ndaray 創建1.2 從字典創建1.3 從標量創建2.Series對象2. Series 是類 ndarray 對象2.2 Series 是類字典對象3.標籤對齊操作4.name屬性二、Dat

原创 運行時出現錯誤AttributeError: 'NoneType' object has no attribute 'format'

運行時出現如下的報錯importpandasaspdimportnumpyasnpprint("Missing required dependencies {values}").format(values=['aaa','bbb'])Att

原创 數據科學包——pandas基礎(整形、透視、時間序列、類別)

文章目錄一、數據整形(stack函數)二、數據透視表(pivot table)三、時間序列1.時間序列2.在不同的時間表達方式間轉換2.1 時間戳轉爲時期 to_period()函數2.2 時期轉爲時間戳 to_timestamp()函數2

原创 數據科學包——pandas基礎(處理丟失數據、統計、合併、分組)

文章目錄一、處理丟失數據1.爲空值數據賦值2.刪除空數據行和列3.填充所有缺失數據4.判斷是否有NaN值二、統計1.平均值、求和、累加和2.shift函數3.sub函數4.apply 應用函數5.計數和衆數三、數據合併1.concat函數2

原创 數據科學包——pandas基礎(創建對象、查看和選擇數據)

文章目錄一、創建數據集對象1.Pandas數據結構Series1.1 普通初始化1.2 指定index1.3 利用字典構造Series1.4 numpy ndarray構建一個Series2.Pandas數據結構DataFrame2.1 普

原创 數據科學包——初識numpy(索引、合併、拷貝)

文章目錄五、索引1.簡單索引1.1 一維數組1.2 二維數組2.數組作爲索引3.bool 索引4.廣播特性六、合併與分割1.合併1.1 vstack,hstack1.2 concatenate1.3 增加維度2.分割2.1 split 平均

原创 數據科學包——初識numpy(創建、屬性、運算)

文章目錄一、Numpy簡介二、numpy創建數組1.dtype定義格式2.定義矩陣三、numpy屬性1.創建一個數組2.查看數組維度3.查看數組類型4.查看數組元素個數四、numpy基礎運算1.數組的加減冪乘1.1 加減冪1.2 乘法2.統

原创 Linux中的shell編程Ⅱ——位置參數、數組、date和cal

文章目錄一、位置參量1.簡介2.位置參量列表3.傳遞位置參數4.退出碼二、數組1.數組定義與初始化2.數組的引用與賦值3.試驗三、date和cal命令1.date 命令1.1 獲取時間1.2 格式化輸出1.3 利用date指令來取得所需要的

原创 Linux中的shell編程Ⅳ——for 循環、while循環

文章目錄一、for循環1.格式2.舉例2.1 逐個打印2.2 十以內整數和二、while循環1.不定循環最常見的兩種表達2.while實現逐行讀取一、for循環1.格式for var in con1 con2 con3... do

原创 Linux中的shell編程Ⅲ——判斷表達式及if語句使用

文章目錄一、判斷1.符號說明1.1 關於某個檔名的`文件類型`判斷1.2 關於檔案的權限偵測1.3 關於兩個整數之間的判定1.4 判定字符串的數據2.判斷符號“[]”二、if 判斷1.單層、簡單條件判斷式2.多重、複雜條件判斷式一、判斷1.

原创 Linux中的shell編程Ⅰ——變量的聲明、引用及作用域

文章目錄一、shell編程二、Shell程序三、變量1.變量命名2.變量類型3.變量賦值3.1 賦值注意事項3.2 顯示變量的值3.3 清除變量3.4 顯示所有變量4.環境變量一、shell編程以文件形式存批量的Linu命令集合,該文件能夠