商品關聯度分析(關聯三度,附Python實戰) 我的錢就是這麼沒的,不只有皮爾森係數的相關分析

在這裏插入圖片描述

引言

   上一年組織燒烤活動買食材時,我在超市的貨架29買了一個燒烤架,然後到貨架27買了瓶1.5L的可樂,最後在貨架25找到了我需要的塑料小碗。今年再去那家超市的時候,特地再去燒烤架所在的貨架查看了一下,看看有沒有什麼值得記錄的靈感。果不其然,擺放在貨架29的燒烤架的邊上就陳列着塑料小碗和大瓶可樂(雖然數量不是很多,但不用再勞煩我奔波於幾個貨架之間了,真聰明!)

   這個線下商店的管理員是怎麼知道應該這樣改進的呢?爲什麼賣燒烤架的貨架旁邊放塑料小碗和大瓶可樂就能夠在整體上促進銷量,而在賣大瓶可樂的貨架旁放置燒烤架反倒對提升銷售額沒有幫助?

   任何一個零售業態,線上線下都好,如果不去分析商品間的關聯分析,則很難發現商品間的隱形密碼,並且也很難做到精細化管理。商品的關聯度分析對於提高商品的活力、挖掘消費者的購買力、促進最大化銷售有很大幫助。事不宜遲,趕快開始!(本文專注於商品間的關聯度分析,商品&價格/天氣/商圈/顧客 之類的廣義上的關聯先不探究)

  讀者蘿蔔: ok,我覺得不用繼續下去了, Person 和 Spearman 係數我已經很熟了,公式原理倒背入流,Python 實現也非常簡單。 df.corr(); df.corr(method=‘spearman’) 而已。

   經營主管:從題目就已經可以看出事情遠沒有那麼簡單,這兩個係數的結果會存在很大的偶然性:數據中顯示喫雪糕的人數和被鯊魚咬傷的人數之間的Person係數爲0.68,快到0.7了,應該屬於強相關了吧?其實是因爲現在是夏天,喫雪糕的人當然會變多,到海灣游泳解暑的人也會增多,被鯊魚咬傷的機率就自然而然的增多了;還有,我之前發現小麪包乾和可樂擺在一起賣能促進銷售額最大化,結果因爲地點問題再次滑鐵盧…

   蘿蔔:怎麼回事呢主管?這兩個係數明明很經典啊,而且你那個麪包可樂不是已經經過實踐檢驗了嘛,怎麼還會失誤?

   經營主管:一句話,分析不到位,不嚴謹,不全面,亂套因果

在這裏插入圖片描述

現在來正式看一下商品關聯度銷售分析是怎麼回事吧。


商品間的三種關係

eg:購買燒烤架的客戶中有55%的顧客會購買可樂,則燒烤架對可樂之間就有了關聯,請注意這是燒烤架對可樂。反過來不一定具有很強的關聯度,畢竟買燒烤架證明你很大可能是將它用到燒烤活動上,有燒烤就要有飲料;但反過來看,我買可樂的原因有很多,燒烤活動只是一個非常非常小的分支。

在這裏插入圖片描述

   蘿蔔:嗯嗯,感覺跟Person相關係數之類的定義會有點像,那該如何判斷呢?有沒有公式什麼的??


商品關聯度分析三度&業務案例

   經營主管:別急,肯定是有的,系統的商品關聯分析必須有三度的概念:支持度、可信度和提升度,具體公式如下圖。

在這裏插入圖片描述

   蘿蔔:真是高大上呀,公式簡單但聽起來有點晦澀,主管你能舉個案例再給我普及一下嗎?

   經營主管:看一個實際業務案例吧。經過數據清洗,發現華潤萬家超市2019年12月總交易次數爲2000次,其中包含燒烤架的交易爲100次,包含啤酒的交易爲200次,同時包含燒烤架和啤酒的交易爲50次,你能根據這些數據計算出這三度的值嗎?

在這裏插入圖片描述

   蘿蔔:支持度=50/2000 * 100%=2.5%;可信度=50/100 * 100% =50%(注意除數與被除數的順序,這裏我把啤酒放在前,即啤酒交易出現在燒烤架中的概率);提升度=50%/(200/2000 * 100%)=5.0(公式的商品B便對應了求解可信度時用到的商品的另一種,這裏便是燒烤架,理解起來就是啤酒在總交易的佔比與啤酒在燒烤架中的佔比的商),ok 主管我求完了,但這些數字又有什麼用呢?

   經營主管:如果把案例中的50改爲10,重新計算後可信度就變成了10%,啤酒在燒烤架一種出現的概率變爲10%,一下子就降低了很多,提升度也降到1.0。也就是說:啤酒在總交易中啤酒在有燒烤架的交易中 出現的概率是一樣的,1.0的提升度可以作爲一個指標的分界值。換言之,啤酒並沒有因爲在和燒烤架的關聯中而得到好處。,在實際業務中,我們可以這樣來理解關聯三度,支持度代表這組關聯商品的份額是否夠大(公式:這一關聯/總交易),可信度代表關聯度的強弱,二提升都則表示該關聯是否有利用價值(即對整體銷售提升的幫助也不會大)。

   蘿蔔:我把主管您的話改一下看看,這兩個商品的關聯性如何,看可信度,這個關聯性是否有意義需要看支持度(你有意義我才支持你),這個關聯規則如華潤萬家的 燒烤架+可樂 這個組合是否值得推廣到其他華潤分店還必須要看提升度。

  • 關聯性:可信度
  • 這個關聯性是否有意義:支持度,你這個關聯度很高如90%,但只是佔總交易的相當小部分,那就沒啥大意義,這種情況完全有可能出現,如巧克力和玫瑰花,在特定的時間和地點關聯度很高,平時不一定有意義
  • 這個關聯規則是否值得推廣:提升度(提升提升,提升銷售額的“提升”)

   經營主管:ok你還挺開竅的,可以這樣理解。通常只看前兩個而不看提升度是比較不全面的。在實際業務中,我們需要對支持度和可信度設定準入貴則,如支持度>=3%, 可信度>=60%,滿足最低准入值則可以視爲商品見的關聯關係有價值。

   蘿蔔:謝謝主管,還想問一下咱們公司有沒有歷史數據給我來練練手,我想用程序探索一下實現流程。

   經營主管:好學精神值得肯定,我回頭髮到你郵箱吧,我先去開會了。


Python實現

   Person 或者 Spearman 係數可以幫助我們先去大概看一下商品之間的相關性,選擇一下相關性高的,然後用商品關聯三度去分析一下是否存在偶然性,還是說是真的高。

在這裏插入圖片描述
在這裏插入圖片描述
至於是怎麼快速實現一行代碼畫出熱力圖的,可參考這篇文章
Python 數據可視化:Matplotlib Heatmap 熱力圖,相關係數矩陣圖(放入自寫庫,一行代碼搞定複雜細節繪圖)
在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

結果出來後,我第一時間 Email 給了主管

   **蘿蔔:**從上述分析結果上看,誰對誰的提升度似乎都好高,那就趕緊把他們放在一起吧?

   主管: 萬萬不可,你沒看到支持度非常低嗎,只有百分之 0.3 幾,也就是說這兩樣東西提升來提升去可能也就最多提升到百分之幾而已,貢獻不一定大,除非這兩個商品是屬於貴重物品或奢侈品。一言以蔽之,得出了結果,還要進行實地調研和用業務頭腦分析,記得之前跟你提到的麪包可樂組合明明很ok,但是推廣到了另外幾家小賣部後慘遭滑鐵盧了嗎?

   蘿蔔: 嗯嗯,您還沒有告訴我。

   主管: 你先來看看這幾家小賣部的分佈圖吧,看有沒有什麼想法?

在這裏插入圖片描述

   蘿蔔: 噢我知道了,我看了一下數據,是夏季,然後公園裏面散步的人口渴,老外喜歡把可口可樂當水喝,所以可樂銷量好是正常的,但因爲 Store1 緊挨着魚池,所以人們會買麪包然後撕成屑去餵魚喂鴿子,而一條大河之隔的另外兩個 Store 則沒魚可喂。

   主管: 挺聰明的嘛,總之顯示情況錯綜複雜,你只是學了點皮毛,還需要不斷精進頭腦,才能實現多維度看問題,今天就先到這裏,下次帶你去了解一下庫存方面的知識吧,實際考察一下。

   蘿蔔: 謝謝主管!

PS:筆者業務思維專欄還有尋找零售密碼的幾種方法,後續將不斷更新

推薦閱讀

  學會提問 | 個人爆發式成長 | Excel 大表格

  一句話成爲心上人特別的存在

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章