基於網絡數據的淨水器銷量影響因素分析

什麼是數據分析呢?數據分析就是利用適當的統計方法對收集來的數據進行分析,將數據彙總,充分發揮數據的作用。接下來聊聊數據分析的大致流程:

1.明確分析的目的,把數據的潛在價值挖掘出來,看看數據本身的規律

2.數據的採集與清洗(無非是線上線下、數據庫之類的,數據清洗也許會是個大工程可能需要將不規整的數據弄得規整)

3.描述統計(以圖形或表格的方式直觀呈現出來,我經常用到圖形可能是直方圖、圖形圖、箱線圖、散點圖等。)

4.進行數據分析及建模

5.報告的撰寫(一份好的數據分析報告,首先需要有一個好的分析框架,並且圖文並茂,層次明晰,能夠讓閱讀者一目瞭然。結構清晰、主次分明可以使閱讀者正確理解報告內容;圖文並茂,可以令數據更加生動活潑,提高視覺衝擊力,有助於閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。好的數據分析報告需要有明確的結論、建議或解決方案。)

這一切的前提是對行業的瞭解,數據與業務的結合,根據業務的需要制定發展計劃,歸類出需要整理的數據。

《基於網絡數據的淨水器銷量影響因素分析》

主要針對自己的論文進行數據分析的瞭解,以統計學、數據挖掘理論知識爲基礎,藉助R語言軟件,通過網絡爬蟲獲淨水器的相關數據。研究淨水器銷量影響因素以及影響程度,藉助迴歸模型進行分析, 由於分析的被解釋變量爲數值型變量,解釋變量爲分類型變量及數值型變量,故建立多元線性迴歸模型進行分析

當時的主要研究框架如下:

指標的選擇:

描述統計

Ø淨水器的銷量作對數直方圖,可以看出淨水器銷量是呈現右偏分佈的

Ø銷量最高的是海爾品牌的非直飲淨水器,保修期爲1年,智能類型爲阿里小智,其原價爲699/元,促銷價爲168/元,價格波動幅度較大。

 

迴歸模型的構建

模型解讀

Ø注:針對取對數後的淨水器銷量分析說明:統一對數線性模型的係數估計解讀爲“增長率”,在控制其它因素不變的情況下:

Ø保修期:保修期爲5年的淨水器銷量最高,比保修期爲1年的銷量高55%

Ø智能類型:阿里小智的淨水器銷量最高,其次爲其他,不支持智能類型的淨水器銷量最低;

Ø功效:非直飲的淨水器銷量最高,功效爲非直飲的淨水器銷量比直飲高12%

Ø店鋪分類:官方旗艦店的淨水器銷量最高,店鋪分類爲官方旗艦店的淨水器銷量比專營店的銷量高17%

Ø物流評分的增加會帶來淨水器銷量的增加;

Ø原價的降低會帶來淨水器銷量的增加;

Ø人氣值的增加可能會帶來淨水器銷量的增加。

Ø對因變量銷量取對數後,建立對數線性模型 ,模型的F檢驗拒絕原假設,說明建立的模型顯著。調整後的可決係數爲0.53,模型的擬合程度尚可接受。

模型檢驗與修正

結論

通過對網絡數據進行描述統計分析和模型分析,得出淨水器銷量影響因素如下所示:

1)淨水器的使用位置影響銷量,即淨水器用在終端淨水的位置還是水運輸過程中的淨水,或者是水源頭淨水的位置,都將影響消費者對淨水器的需求。

2)店鋪分類對淨水器的銷量有影響,專賣店和官方旗艦店的口碑,影響淨水器的銷量。

3)淨水器的智能類型影響淨水器的銷量,淨水器的質量效果越好,其銷量將會受到影響。

4)淨水器的功效決定淨水器的用途,其功效也影響淨水器的銷量。功效爲非直飲功效的銷量比較高,而大多數消費者還是比較親睞於非直飲的淨水器。

5)淨水器的網絡店鋪評分影響淨水器的銷量。對店鋪評分越高,被顧客關注度越高,淨水器銷售的成交量越高。

6)保修期時間長的淨水器銷量較高,保修時間長使得顧客安全感提升且省去了很多維修費用。

7)淨水器價格低且打折力度大也會使得淨水器的銷量提高。

8)當人氣值和累計評價較高時,增加了消費者的購物信心其產品的銷量也就會有所提高。

建議

創新點與不足

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章