原创 機器學習“傻瓜式”理解(10)模型評估

過擬合與欠擬合問題 我們進行機器學習的目標是尋找出一個模型,使得這個模型對於我們的預測點能夠給予準確的解答,而不是讓其最大程度的擬合我們的訓練數據集的樣本點。我們將這種能力稱之爲模型的泛化能力。(解決模型泛化能力可以稱之爲機器學習

原创 機器學習“傻瓜式”理解(9)多項式迴歸(第一部分:基礎理解+應用)

基礎理解: 之前我們提到過多元線性迴歸,多元線性迴歸指的是每一個特徵與目標值(y)呈線性關係,但多項式迴歸指的是樣本特徵與目標值(y)呈非線性關係,例如:y = ax^2 + bx + c,其中x^2可以看做是人爲添加的另一個特徵

原创 機器學習“傻瓜式”理解(4)KNN算法(數據處理以及超參數)

數據處理以及超參數的理解 首先我們需要瞭解到,我們在進行機器學習的過程中尋求的不是讓訓練處的在現有的數據集上達到最佳,而是我們需要讓其在真實環境中達到最佳的效果。在上一節中我們將全部的數據集全部用於訓練模型中,對於我們所訓練出的模

原创 機器學習“傻瓜式”理解(5)線性迴歸(簡單+評估+多元)

1.基礎理解: 先來講解簡單線性迴歸,通過一張圖基礎理解一下: 通過對上圖的理解我們可以簡單概括一下簡單線性迴歸: 只有一個特徵,在多個數據集中我們儘可能的尋找一條直線能夠最大程度的擬合這些數據,正如圖片中所示,我們尋找除了一個