僅用 8 行代碼即可建立一個線性迴歸模型

本文最初發表在 Towards Data Science 博客,經原作者 Braden Riggs 授權,InfoQ 中文站翻譯並分享。

數學建模和機器學習常常會讓人感覺像是難以探索和學習的課題,尤其是對那些不熟悉計算機科學和數學領域的人來說尤爲如此。我很驚訝地從我的非理工科的朋友那裏聽到,他們在自己的項目中嘗試使用基本的建模技術時感到不知所措,而且他們可能會陷入這個領域的語義中。這是一種恥辱,因爲線性建模在許多情況下都是非常有用的,並且加上互聯網上的所有開放源代碼,實現自己的模型從未如此簡單過。因此,下面是我用 Python 理解並實現基本線性迴歸模型的簡單指南。

什麼是線性迴歸?

線性迴歸是一種數學建模的一種形式,通常用於評估因變量(如體重)和自變量(如身高)之間的關係。我們的大腦能夠很自然地做到這一點,只是以一種不太精確的方式而已。如果我讓你判定 189 釐米和 158 釐米的人哪個人體重更重,你可能會選擇 189 釐米的人。當然,158 釐米的人也可能會更重,但我敢打賭,在你與人交往的經歷中,你已經確定了人的身高與體重之間的某種關係。線性迴歸就是建立這種關係並從中提取意義的一種精確的數學方法。

它是如何工作的?

線性迴歸的工作原理是通過創建一條最佳擬合線。最佳擬合線是最能捕捉 X 軸和 Y 軸之間關係的直線。例如,這種關係可以是,隨着“X”的增加,“Y”也會隨之增加:

原文鏈接:【https://www.infoq.cn/article/H5MDLR2jq4jidAFMphuV】。未經作者許可,禁止轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章