相關係數矩陣(Correlation matrix)是數據分析的基本工具。它們讓我們瞭解不同的變量是如何相互關聯的。在Python中,有很多個方法可以計算相關係數矩陣,今天我們來對這些方法進行一個總結
Pandas
Pandas的DataFrame對象可以使用corr方法直接創建相關矩陣。由於數據科學領域的大多數人都在使用Pandas來獲取數據,因此這通常是檢查數據相關性的最快、最簡單的方法之一。
import pandas as pd
import seaborn as sns
data = sns.load_dataset('mpg')
correlation_matrix = data.corr(numeric_only=True)
correlation_matrix
如果你是統計和分析相關工作的,你可能會問" p值在哪裏?",在最後我們會有介紹
https://avoid.overfit.cn/post/836b5590a96045faae2774bb3f23c9ef