- 機器學習的基本思路
- 現實問題抽象爲數學問題,機器解決數學問題從而解決現實問題
- 通過訓練集,不斷識別特徵,不斷建模,最後形成有效的模型,這個過程就叫“機器學習”!
- 認字的卡片在機器學習中叫——訓練集
- “一條橫線,兩條橫線”這種區分不同漢字的屬性叫——特徵
- 不斷學習的過程叫——建模
- 學會了識字後總結出來的規律叫——模型
- 監督學習、非監督學習、強化學習
- 監督學習是指我們給算法一個數據集,並且給定正確答案。機器通過數據來學習正確答案的計算方法
- 非監督學習中,給定的數據集沒有“正確答案”,所有的數據都是一樣的。無監督學習的任務是從給定的數據集中,挖掘出潛在的結構。
- 強化學習更接近生物學習的本質,因此有望獲得更高的智能。它關注的是智能體如何在環境中採取一系列行爲,從而獲得最大的累積回報。通過強化學習,一個智能體應該知道在什麼狀態下應該採取什麼行爲。
- 最典型的場景就是打遊戲。
- 機器學習實操的7個步驟
- 收集數據
- 數據的數量和質量直接決定了預測模型的好壞。
- 數據準備
- 涉及到數據清洗,沒有什麼問題後,我們將數據分成3個部分:訓練集(60%)用來訓練模型、驗證集(20%)確保模型沒有過擬合、測試集(20%),用於後面的驗證和評估工作
- 選擇一個模型
- 訓練
- 機器獨立就可以完成,整個過程就好像是在做算術題。因爲機器學習的本質就是將問題轉化爲數學問題,然後解答數學題的過程
- 評估
- 評估的指標主要有 準確率、召回率、F值
- 參數調整
- 完成評估後,改進訓練。通過調整參數來做到這一點。當進行訓練時,隱含地假設了一些參數,可以通過認爲的調整這些參數讓模型表現的更出色。
- 預測(開始使用)
- 收集數據