Python數據分析之商品數據分析

閱讀提示

本文將使用Python語言對市面上火爆的0卡飲料——元氣森林氣泡水多維度分析,它的味道怎麼樣?大家是如何評價它的呢?


在這裏插入圖片描述
提到數據分析的時候,我們可能最先想到的就是柱狀圖、餅圖,高端一點的有詞雲等等,但總有一些大佬會Diss你 :詞雲太簡單了吧,有點low

1、如何入手

在做數據分析的時候我們通常會遇到兩種情況:

1、分析不出結果歸咎於數據量不夠、維度不夠等因素

2、自己不會使用複雜的算法構造模型來預測或分析,也沒有去思考如何通過學習來進一步的完成完成分析工作

數據維度和算法的價值當然不言而喻,但總是把分析不出結果和價值的鍋甩出去,這種歸錯於外的思維非常危險,它營造了一種“ 分析不出結果,我也沒辦法” 的心安理得。

2、選擇分析對象

這裏我將選用市面上很火的一種0卡飲料,元氣森林氣泡水來作爲本次分析的對象。

那麼如何對該商品進行簡單且粗暴的分析呢?讓我們繼續往下進行。

3、明確目標

我們的目標是什麼?

我們想要通過這次分析得到什麼?

比如我們本次分析的要求是: 基於評價,更好的瞭解消費者對產品的看法

所以 我們的最終目標就是 “基於評價反饋,量化消費者感知,指導優化產品”


4、對目標進行分解

不知道大家有沒有聽過一種世界上最牛掰的學習方法:費曼技巧

總結一下的話就是: 用大白話去解釋新知識,然後通過這種行爲加深自己的理解


“拆” 的藝術大體可以分爲兩步

第一步是換位思考。

評價來源於買家,買家對產品有哪些方面的需求或者感知呢?

第二步,基於換位的邏輯拆解

這裏可以按照模擬購物流程的邏輯來拆解:

首先,氣泡水本身有非常強的 知名度 買家或多或少是慕名而來。所以,在購買時,到底有多大比例是衝着氣泡水這個名號來的呢?

物流,付款到收貨用了幾天?派送員態度怎麼樣,送貨上門了嗎?

收到貨後 包裝 怎麼樣。外包裝有沒有破損?有沒有變形?產品包裝是精緻還是粗糙?

接下來是 產品體驗,拿氣泡水來說,日期是否比較新?口味買家是否喜歡?到底好不好喝?0卡的噱頭到底有沒有用?

品嚐飲料之後,我們可以建立對產品的立體感知——性價比。花錢買這個產品到底值不值?這個價位是貴了還是便宜?實惠不實惠?

這樣,我們就將 品牌、物流、包裝、產品(日期、口味)和性價比五大方面初步展現出來了

5、數據處理

這裏我們用一種簡單粗暴的方式,按標點把整條評論拆分成零散的模塊,再設置一系列預置詞來遍歷

首先我們查看一下抓取到的評論:

根據標點符號來拆分內容

for i in df['初評內容']:
    result.append(re.split('[::,,.。!!~·`\;; ……、]',i))

看一下拆分後的效果

已經可以看到,初步對用戶的評論進行了斷句,觀察評論不難看出他們的主要內容涉及到品牌(元氣水)、物流、口味、性價比等方面,所以這裏我們用一個笨辦法,依次去遍歷內容,如果評論中沒有相關內容我們就跳過,有的話再對用戶的評論進行情感分析(喜歡或者不喜歡)

我們以口味爲例來對用戶評論進行遍歷:

#產品口味,共三種
if '橘子' in word or '橘' in word :
    judges.iloc[i]['橘子口味'] = 1
elif '白桃' in word or '桃子' in word or '桃' in word:
    judges.iloc[i]['白桃口味'] = 1
elif '青瓜' in word or '黃瓜' in word:
    judges.iloc[i]['青瓜口味']

物流爲例來對用戶評論進行遍歷:

#先判斷是不是物流相關的
if '物流' in word or '快遞' in word or '配送' in word or '取貨' in word or '送貨' in word:
    #再判斷是正面還是負面
	if '好' in word or '不錯' in word or '棒' in word or '滿意' in word or '迅速' in word:
    	judges.iloc[i]['物流正面'] = 1
    elif '慢' in word or '龜速' in word or '暴力' in word or '差' in word:
        judges.iloc[i]['物流負面'] = 1

#判斷是否包裝相關
if '包裝' in word or '盒子' in word or '袋子' in word or '外觀' in word:
	if '高端' in word or '大氣' in word or '還行' in word or '完整' in word or '好' in word or '嚴實' in word or '緊' in word:
		judges.iloc[i]['包裝正面'] = 1
    elif  '破' in word or '破損' in word or '癟' in word or '簡陋' in word:
        judges.iloc[i]['包裝負面'] = 1

其他方面就不再一一贅述,請各位讀者根據自身情況設置合理的遍歷方法。

我們運行一下,看看遍歷後的效果如何:

第一條評論中很明顯的能看出,買家反應了物流快、價格便宜等信息,所以我們對物流正面、性價比正面加了一分。

第二條中買家提到了好喝,那麼就是口感方面的正面評價,也對其加一分。

第十條提到了商品ip屬性和口感方面,也追加一分。

總的來說達到了我們想要的目的!雖然代碼比較簡陋但效果還不錯!

6、 結果分析

首先我們將結果彙總在同一張表裏

這樣看來可能不夠明顯,我們用Tableau做個圖看看:

我們可以看出,口感是用戶比較關注的點,佔了絕大部分的比例,相比於其他的日期、口味等等遙遙領先。

緊隨其後的便是性價比、物流了。

不同類別 正負面評價 佔比是怎麼樣的呢?

從整體來看,評論整體趨向於好評,其中口味(橘子、青瓜、白桃)這邊沒辦法細分,口感、性價比、物流方面 正面評論佔了絕對的主導。

那麼正面評價主要來自於哪裏呢?我們看看口感方面的正面評價:

初步篩選後,我們可以看到,一共給出了194口感的正面評價,可以說這個氣泡水的口味是相當的讚了!那麼其中白桃口味佔到的比例更高,最奇怪的是沒有人提到青瓜口味(說實話我挺愛喝這個青瓜口味的,比較爽口),可能是我們本次取到的樣本數不足的原因。

在性價比方面:

正面評論一共提到62次,可以看出元氣森林的氣泡水從口味、口感、包括所宣傳的0卡、低熱量等方面都做的很不錯,價格也比較親民。可能因爲本次分析所採集到的數據不夠全面導致部分方向與實際有些偏差,但我們也大膽的進行分析,給出性價比負面評價的買家很可能是對價格不夠滿意,在市面上爲5-6元一瓶,部分買家可能也會有所顧忌,但鑑於大家對口感方面有99%的好評率,我們可以通過進行打折促銷活動,或者多買多送等活動來吸引這部分對價格敏感的消費者。

結語

在最後,我們展示一下部分買家的對白桃口味汽水的評價吧(這個口味是大家最喜歡的口味哦!)

至此,我們本次分析就告一段落了,我們採用了最簡單淺顯的方式對獲取到的評論進行了拆分,並將拆分後的字符串進行了分析、量化、可視化等操作,距離接觸到真正的數據分析又近了一步~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章