用Python和Tableau對母嬰商品銷量進行數據分析(附Python源碼及Tableau文件)

每晚九點,我們準時相約  


爲減少篇幅,本文將盡量少的配上源碼,在文末提供的源碼文件中已經有詳細註釋。

本案例結合Python和Tableau,由於數據量及維度較少,所以更多的是使用Tableau進行可視化處理。

項目介紹

項目背景

根據PEST框架,從四個角度簡要分析:

  • 政策Politics:國家發展改革委2013年5月28日表示,13個部門將出臺系列政策措施,從可信交易、移動支付、網絡電子發票、商貿流通和物流配送共5個方面支持電子商務發展,有利於促進在線母嬰商品市場快速發展。

  • 經濟Economy:隨着國內經濟的穩定增長,2015年我國城鎮居民可支配收入增長到31195元, 同期農村居民可支配收入增長到11422元。不斷提高的人均可支配收入將提升家庭的消費意願,2015年中國母嬰行業市場規模有望達到2萬億。

  • 社會Society:對於一線城市居民來說,隨時隨地通過手機、電腦等電子網絡設備足不出門即可完成購物的新型消費方式更能適應他們緊湊的生活節奏;而對於二三線城市以及農村居民,物流上門配送帶來的便捷也使得網購更具吸引力。

  • 技術Technology:4G網絡的普及、手機和ipad等移動設備快速升級迭代更新、網絡在線支付系統的發展,爲電子商務迅速崛起注入強大的動力。

分析目的

  1. 幫助在線商家針對不同的時間節點和場景做出不同的銷售和運營管理策略,幫助商家提高銷量和營業額、減少經營成本。

  2. 根據孩子的信息(年齡、性別等)來預測用戶會購買什麼樣的商品。(暫未完成)

問題拆解

問題拆解圖

數據概覽

Ali_Mum_Baby是一個包含超過900萬兒童信息(生日和性別)的數據集,由消費者提供,他們共享這些信息是爲了獲得更好的推薦或搜索結果。本次數據共有兩個csv。嬰兒信息表

ColumnDescription
user_iduser id
birthdaychildren's birthday
gender0-female,1-male,2-unknown

交易記錄表

ColumnDescription
item_iditem id
user_iduser id
cat_idcategory id
cat1root category id
properyproperty of the corresponding item
buy_mountpurchase quantity
daytimestamp

數據準備

導入數據

baby = pd.read_csv("./sam_tianchi_mum_baby.csv")
trade =pd.read_csv("./sam_tianchi_mum_baby_trade_history.csv")

概覽數據

  • baby表只有3個維度,共953行數據,無缺失值。

  • trade表有7個維度,共29971行數據,無缺失值。

  • trade.property是商品屬性,由於全是數值字符串,所以我們先刪除。trade表中的buy_mount是我們關注的重要標籤,從描述性統計以及圖像上來看,該數據的均值爲2.5,標準差64,存在異常值,所以我們保存距離均值3個標準差內的數據,即[0,195]。

數據清洗

  1. 查看有無缺失值異常值,並進行處理。

  2. trade中的auction_id未指定是什麼屬性,我們就將他默認改爲item_id。

  3. 數據集中的property全是數字,需要有對應的字典才能知道對應什麼屬性,這邊先刪除。

  4. day改成日期形式。

# 根據info()查看,本數據集無缺失值
# 列重命名
trade.rename({"auction_id":"item_id"},axis=1,inplace=True)
# 先將property暫且取出放在一邊,後續再分析
property = trade.property
trade.drop('property',axis=1,inplace=True)
# 日期類型轉換
baby['birthday']=pd.to_datetime(baby.birthday.astype('str'))
trade['day'] = pd.to_datetime(trade.day.astype('str'))

經過清洗後的數據保留下29942行。統計時間是2012/7/2-2015/2/5。整個數據集中共6個商品大類,662個商品分類,28394件商品,29915名用戶。

這是兩年多經過刪減的數據,由於缺少部分數據,所以我們只能根據這份數據集進行分析。主要是思路。

數據分析

整體市場情況

2017/7-2015/2期間總銷量是49973件,從上圖我們可以看出淘寶和天貓平臺母嬰商品市場銷量整體呈現上升趨勢,但是波動較大。

  1. 2015年由於數據缺失,所以不能反應2015年第一季度的真實銷量情況

  2. 每年第一季度的銷售額都會呈現一定幅度的下跌。每年第四季度的銷量都會呈現大幅度上升。

在這裏插入圖片描述
  1. 2013年和2014年的第一季度銷量都有所下滑,主要聚集在1、2月。

  2. 每年的5月、11月都會出現不同程度的銷量上漲。

第一季度銷量下降原因

假設第一季度下降原因是和春節有關。

  • 2013/2/1-2013/2/15處於銷量谷底,2013年春節假期:2013/2/9-2013/2/15

  • 2014/1/26-2014/2/4處於銷售谷底,2014年春節假期:2014/1/31-2014/2/6

2015年春節假期是2015/2/18-2015/2/24,數據集統計時間只到2015/2/5,所以就暫不分析2015年第一季度情況

臨近春節可能存在部分企業提早放假,快遞停運,銷售低谷時段與春節假期基本吻合,假期結束後購買量和用戶量上升,所以可以認爲第一季度銷量下降是由春節假期造成的。

第四季度銷量上漲原因

假設和雙十一雙十二活動有關。

  1. 可以很明顯看出2013年和2014年雙十一及雙十二當天的銷量和銷售額都激增。

  2. 每年的雙十一活動用戶量和銷量都比往年多,用戶量增長爲75%-80%。

所以可以認爲每年第四季度的銷量上漲和雙十一雙十二活動有很大的關係。

復購率

各月產品復購率極低。各大類的復購率也極低,均未有超過1%,其中大類38的復購率最高爲0.17%。考慮到用戶單次購買量大多是一件,且復購率低,說明用戶對單一商品的回購慾望極低,商家應該從產品角度進行考慮,例如產品質量及購物體驗等。

商品銷量情況

大類28和50008168銷量最佳,大類38雖然銷量低、子類數最少但是人均購買量卻很高,說明用戶在購買38大類下的產品時選擇餘地較少,但同時用戶對此類產品的需求又很旺盛,可以適量的增加大類38下的子類產品,提高銷售量。12265008產品的銷量、人均需求量都不高。說明用戶對這類產品的需求低,建議減少進貨,以免庫存積壓。

嬰兒情況

將兩張表inner連接後發現存在1984年的嬰兒,明顯屬於異常值,我們要剔除掉。由於數據統計到2015/2,所以我們假定分析日期爲2015/3,購買母嬰商品的用戶中,嬰兒年齡主要集中在0-3歲。購買母嬰產品的用戶家庭中有47.1%是男嬰,52.9%是女嬰。我們將嬰兒年齡進行分組,分別是未出生、嬰兒期(0-12個月)、幼兒期(1-3歲)、學齡前期(3-7歲)、學齡期(7+)。

根據上圖我們不難看出嬰兒各階段的熱銷大類:

  • 未出生:50014815、50022520、5008168、28

  • 嬰兒期:50014815、50022520、5008168、28

  • 幼兒期:50014815、50008168、28

  • 學齡前期:50008168、28

  • 學齡期:50008168

隨着嬰兒年齡增長50008168大類的產品需求量逐漸增長而50014815大類的產品需求量逐漸降低。女嬰家庭的商品需求量明顯大於男性家庭,我們細分到商品類別看一下。可以看到大類50014815下的50018831商品的銷售記錄中有71.05%都是由女嬰家庭購買的。在購買記錄中不乏某些高銷量產品的女嬰家庭購買佔比爲100%的情況。

總結

產品銷售情況

  1. 母嬰產品銷量呈逐年增長趨勢,但是每月的波動幅度較大。

  2. 每年受春節影響,第一季度的銷量會出現全年低點;在雙十一及雙十二等活動促銷下,第四季度銷量會達到全年峯值。

  3. 用戶復購率極低,需要從產品質量、價格及購買體驗等方面進行考慮改善。

  4. 50014815、50008168和28是熱銷大類TOP3

  5. 大類38雖然銷量少但是人均用戶購買量卻很大,可以考慮在該大類下新增子類,增加用戶選擇,提高銷量。

用戶畫像

  1. 幼兒期(1-3歲)的用戶需求量最大,隨着嬰兒年齡增長,母嬰商品需求量逐漸降低。

  2. 男女嬰兒家庭比例接近,但是女嬰家庭的購買量明顯大於男嬰家庭。

  3. 部分商品的女嬰家庭購買比例明顯大於男嬰家庭。可對該類商品進行進一步的女嬰化改變,以促使更多的女嬰家庭購買。

建議

  1. 在臨近春節前一個星期應該減少產品推廣投入,減少進貨量,保留低量庫存;雙十一及雙十二預熱階段需要加大力度推廣,豐富運營活動,吸引更多的客流量。同時,要增加產品庫存,保證穩定貨物供應。要增加客服人員,及時與物流聯繫,保證能夠及時解答用戶疑問並提高出貨效率,提高用戶購買體驗。

  2. 產品復購率偏低。需要加強對已購用戶的回訪,分析不回購的原因,並對這些因素進行改善。

  3. 女嬰家庭購買量高於男嬰家庭,建議多推廣專爲男嬰設計的產品,提高男嬰家庭的購買量。

  4. 要擴充各大類下的子類產品,特別是大類38,增加用戶選擇,提高子類商品銷量,進而提高大類銷量。

  5. 減少12265008大類下的產品進貨,以免庫存積壓。

參考文章

[1]

母嬰產品電商銷售情況的深入分析: https://zhuanlan.zhihu.com/p/129072269

本文的源數據,Python源碼及Tableau文件

關注公衆號「凹凸數據」後臺回覆“母嬰”即可獲取

後臺回覆「進羣」,加入讀者交流羣~

昨日留言['遠方,星空', 'R', '柚']獲得積

跟昨天規則一樣,限時300積分。大家給本文點擊在看留言隨機抽取三個分別300、100、50積分,可以兌換本書,也可兌換積分商城任意書籍

朱小五

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章