爲什麼在線性模型中相互作用的變量要相乘

在這篇文章中,我將解釋爲什麼當建立一個線性模型,我們添加一個x₁₂術語如果我們認爲變量x₁和x₂互動和添加交互條款訂立原則方法。

我假設讀者對線性模型的工作原理有一個基本的瞭解。

無交互模型

讓我們從構建一個沒有相互作用項的模型開始。

假設我們想要模型y的函數x₁和x₂。則描述該關係的線性模型爲:


圖1:沒有相互作用項的線性模型

一個變斜率的模型

假設我們認爲x₁實際上取決於x₂的斜率。我們如何將這種信念融入到模型中?

因爲我們正在與線性模型,方法之一是模型β₁作爲另一個x的函數₂線性模型,如下所示:

圖2:假設x1的斜率依賴於x2的效果

將圖2的方程代入圖1,得到擬合模型如下:

圖3:擬合線性模型假定的影響x₁的值取決於x₂

圖3中的模型如圖1是一模一樣,除了它有一個額外的術語,bx x₁₂。

這種方式建立一個線性模型的相互作用項是自然結果表明假設x₁y是線性的影響依賴於x₂的當前值。

x₁ 依賴於 x₂與 x₂ 依賴於 x₁是一樣的

前一節中建立在假設x₁的效果取決於x₂的當前值。如果我們有什麼做的假設另一個方向即x₂的影響取決於的當前值x₁?

用同樣的方法,假設意味着:

圖4:假設x₂取決於x₁的斜率

我們最終擬合的模型是這樣的:

圖5:擬合線性模型假設x₂的影響取決於x₁的值

請注意,上圖中的模型與圖4中的模型相同(它們僅在分配給係數的名稱上有所不同)。

這是一個值得一提的強調,添加一個x₁x₂ 沒有說任何關於x₁和x₂之間的因果關係。

涉及兩個以上變量的作用

這種增加相互作用項的方法表明,通過遞歸應用一個變量的斜率依賴於另一個變量的假設,可以得到涉及兩個以上變量的交互作用。

例如,假設我們想要模型之間的關係x和y₁, x₂, x₃使用線性模型。

現在,如果我們假設x₁的斜率取決於x₂,我們有:


圖6:假設x₁取決於x₂的斜率

如果我們進一步假設x₂在圖6的斜率是依賴於x₃,我們得到:

圖7:假設x₂β的影響x₁還取決於₃

所以,給定:


圖8:y的函數x₁, x₂x₃

我們的結果是:


圖9:一個模型假設x₁的影響取決於x₂,而x₂取決於x₃

如果我們曾以爲不同的順序即斜率x₁取決於x₃這取決於x₂?然後,給出:

圖10:與圖8相同的假設,只是順序不同

得到:

圖11:基於圖10中的假設的模型

注意,圖11和圖9中的模型是不同的。它們在第五項有所不同。

結論

本文表明,相互作用項可以解釋爲假設一個特定變量的斜率依賴於另一個變量的值。

使用這種方法,我們就有了一種系統的方法,使用我們的領域知識來智能地添加相互作用項,而不是在我們的數據集中添加所有可能的變量組合。後一種方法可能導致模型過度擬合和/或給出錯誤的因果推斷。

deephub翻譯組

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章