Excel-散點圖(相關性及數據分佈)分析

本文摘自作者《網站數據分析:數據驅動的網站管理、優化和運營 》:http://item.jd.com/11295690.html


散點圖是用來判斷兩個變量之間的相互關係的工具,一般情況下,散點圖用兩組數據構成多個座標點,通過觀察座標點的分佈,判斷變量間是否存在關聯關係,以及相關關係的強度。此外,如果不存在相關關係,可以使用散點圖總結特徵點的分佈模式,即矩陣圖(象限圖)。


1.相關關係分析


需要注意的是,相關關係不同於因果關係,相關性表示兩個變量同時變化,而因果關係是一個變量導致另一個變量變化。散點圖只是一種數據的初步分析工具,能夠直觀地觀察兩組數據可能存在什麼關係,在分析時如果找到變量間存在可能的關係,則需要進一步確認是否存在因果關係,使用更多的統計分析工具進行分析。


進行相關關係分析時,應使用連續數據,一般在x軸(橫軸)上放置自變量,y軸(縱軸)上放置因變量,在座標系上繪製出相應的點。散點圖的形狀可能表現爲變量間的線性關係、指數關係或對數關係等,以線性關係爲例,散點圖一般會包括如下幾種典型形狀。


  • 正相關:自變量x變大時,因變量y隨之變大;

  • 負相關:自變量x變大時,因變量y隨之變小;

  • 不相關:因變量y不隨自變量x的變化而變化。


例如,網站統計了客戶收貨天數和滿意度結果,滿意度最高爲5分,如圖9-61所示。選定A1:B30區域,在 插入功能區的圖表模塊中單擊散點圖,選擇僅帶數據標記的散點圖按鈕,即可看到繪製的散點圖,右擊某個數據標記點,在彈出的快捷菜單中選擇“添加趨勢線”命令,並進行添加分類軸和數據軸標題等圖表美化,最終效果如圖9-62所示


         9-61 客戶滿意度調查數據          

         9-62 最終美化後的散點圖


分析散點圖可以發現,收貨天數和客戶滿意度存在負相關關係,收貨天數越長,客戶滿意度越低。


2.矩陣分析


9-63是某網站對所銷售產品在企業戰略、經營績效兩方面所作的影響程度分析。企業戰略是指對企業長期發展、生存的考慮,產品設置更注重於競爭對手因素和後期效益,經營績效則是指產品對當期企業效益的影響程度。企業戰略和當期績效沒有很必然的聯繫。

9-63 產品對企業戰略、經營績效的影響程度分析結果


  • 選定B2:C14區域,在插入功能區的圖表模塊中單擊散點圖,選擇“僅帶數據標記的散點圖”,然後刪除圖例和網格線,效果如圖9-64所示。

9-64 刪除圖例和網格線後的散點圖效果


  • 要實現矩陣效果,還需要移動橫座標軸和縱座標軸。選定橫座標軸,單擊鼠標右鍵,選擇“設置座標軸格式”命令打開設置對話框,在“座標軸選項”中下方“縱座標軸交叉於座標軸值”輸入已經計算好的企業戰略平均值2.7,同時把“主要刻度線類型”、“座標軸標籤”都設置爲“無”,如圖9-65所示。

9-65 設置座標軸格式


  • 同理。選定縱座標軸,單擊鼠標右鍵,選擇“設置座標軸格式”命令打開設置對話框,在“座標軸選項”中下方“橫座標軸交叉於座標軸值”輸入已經計算好的經營績效平均值2.8,同時把“主要刻度線類型”、“座標軸標籤”都設置爲“無”,矩陣圖效果如圖9-66所示。

9-66 移動座標軸後的矩陣圖效果


  • 可以看到縱座標軸和橫座標軸的交叉點有點靠右上角,這可以通過設置座標軸的最大、最小值來解決。重新打開橫、縱座標的“設置座標軸格式”對話框,將最大值、最小值分別設置爲比各產品企業戰略、經營績效的最大值略大、最小值略小的值。在該示例中,將橫、縱座標軸的最大、最小值均分別設置成了41.5

  • 添加座標軸標題,並在其中標示出高、低方向。

  • 右擊任意系列點,選擇“添加數據標籤”命令爲各點添加標籤,並將標籤修改爲產品名稱[1],最終結果如圖9-67所示。

9-67 最終美化後的散點圖


可以發現,產品A對企業戰略、經營績效的影響都很大,F產品影響程度最低,LKGDMH產品對企業戰略影響大,CE產品對經營績效影響大。通過矩陣圖,管理者可以很容易地作出相關決策。




[1] 如果系列點較多,可以“宏”程序進行批量修改標籤,相關信息可參考http://club.excelhome.net/thread-256051-1-1.html的介紹。




發佈了92 篇原創文章 · 獲贊 107 · 訪問量 116萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章