原创 第五週:梯度下降算法

學習目標 瞭解梯度下降算法 實現梯度下降算法 什麼是梯度下降 《還不瞭解梯度下降法?看完這篇就懂了!》 梯度下降法應用 在之前的幾周學習中,瞭解了kNN和線性迴歸算法,機器學習就是尋找一個函數f(x),並對其進行優化,使其

原创 第二週:機器學習模型的評價指標

學習目標 數據拆分 數據集一般分爲如下三種,比例一般是8:1:1。 訓練集:確定模型後,用於訓練普通參數(每多加入一個數據對模型進行訓練,模型中就會受到影響的參數,通過多次迭代不斷更新,是一個梯度下降的過程)而不是模型的超參數。

原创 第七週:邏輯迴歸算法

學習目標 邏輯迴歸的本質及其數學推導 邏輯迴歸代碼實現與調用 邏輯迴歸中的決策邊界、多項式以及正則化 邏輯迴歸的本質及其數學推導 《出場率No.1的邏輯迴歸算法,是怎樣“煉成”的?》 《邏輯迴歸的本質及其損失函數的推導、求解》

原创 第六週:正則化及機器學習中的概念補充

學習目標 多項式迴歸與模型複雜度 正則化 模型的偏差和方差 多項式迴歸與模型複雜度 《淺析多項式迴歸與sklearn中的Pipeline》 多項式迴歸,通俗來看就是對數據集用多項式進行擬合,相較於線性迴歸,多項式可以擬合曲線細

原创 第四周:線性迴歸算法

學習目標: 簡單線性迴歸:簡單線性迴歸及最小二乘法的數據推導 實踐:簡單線性迴歸實現及向量化應用 多元線性迴歸:多元線性迴歸和正規方程解及實現 線性迴歸和最小二乘法 《模型之母:簡單線性迴歸&最小二乘法》 線性模型形式簡單、易

原创 第三週:數據預處理及kNN算法優化與總結

學習目標 無量綱化:最值歸一化、均值方差歸一化及sklearn中的Scaler 缺失值處理 處理分類型特徵:編碼與啞變量 處理連續型特徵:二值化與分段 kNN算法優化與總結 無量綱化 概念及背景 無量綱化處理主要是用於消除不同

原创 第一週:機器學習的敲門磚kNN算法

學習目標: 瞭解監督學習和非監督學習的概念 瞭解kNN算法的思想及其原理 kNN算法實戰 監督學習 《統計學習方法》一書中概括,統計機器學習包括監督學習、非監督學習、半監督學習以及強化學習。 監督學習 通俗來說,就是給

原创 上海鏈家二手房交易數據分析

【python】上海鏈家二手房交易數據分析 目的:練習pandas數據處理以及數據可視化 數據採集時間:2017/11/7 數據獲取:八爪魚數據採集工具 數據量:約3w條 字段:行政區、小區名稱、房型、樓層、朝向、單價、總價、建造年代等