深入瞭解機器學習 (Descending into ML):線性迴歸

人們早就知曉,相比涼爽的天氣,蟋蟀在較爲炎熱的天氣裏鳴叫更爲頻繁。數十年來,專業和業餘昆蟲學者已將每分鐘的鳴叫聲和溫度方面的數據編入目錄。Ruth 阿姨將她喜愛的蟋蟀數據庫作爲生日禮物送給您,並邀請您自己利用該數據庫訓練一個模型,從而預測鳴叫聲與溫度的關係。

首先建議您將數據繪製成圖表,瞭解下數據的分佈情況:
在這裏插入圖片描述
圖 1. 每分鐘的鳴叫聲與溫度(攝氏度)的關係。

毫無疑問,此曲線圖表明溫度隨着鳴叫聲次數的增加而上升。鳴叫聲與溫度之間的關係是線性關係嗎?是的,您可以繪製一條直線來近似地表示這種關係,如下所示:

在這裏插入圖片描述

圖 2. 線性關係。

事實上,雖然該直線並未精確無誤地經過每個點,但針對我們擁有的數據,清楚地顯示了鳴叫聲與溫度之間的關係。只需運用一點代數知識,您就可以將這種關係寫下來,如下所示:
在這裏插入圖片描述
其中:

  • y 指的是溫度(以攝氏度表示),即我們試圖預測的值。
  • m 指的是直線的斜率。
  • x 指的是每分鐘的鳴叫聲次數,即輸入特徵的值。
  • b 指的是 y 軸截距。

按照機器學習的慣例,您需要寫一個存在細微差別的模型方程式:
在這裏插入圖片描述
其中:

  • y’指的是預測標籤(理想輸出值)。
  • b指的是偏差(y 軸截距)。而在一些機器學習文檔中,它稱爲 。
  • w1 指的是特徵 1 的權重。權重與上文中用 表示的“斜率”的概念相同。
  • x1 指的是特徵(已知輸入項)。

要根據新的每分鐘的鳴叫聲值 x1 推斷(預測)溫度 ,只需將 x1 值代入此模型即可。

下標(例如 w1 和 x1 )預示着可以用多個特徵來表示更復雜的模型。例如,具有三個特徵的模型可以採用以下方程式:
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章