用戶畫像分析相關整理

前期做了一些用戶畫像的數據支持工作,都是哪裏需要往哪搬,沒有進行過系統的總結,總歸不是自己的東西,只知道要這麼做,卻不知爲何要這麼做,所以在這裏進行一個歸納總結。
用戶畫像一般用於研究當前客戶需求以及挖掘潛在客戶,用戶畫像需要結合具體的場景進行分析,不同場景下分析也是存在差異的,自己工作中接觸的數據主要爲目標客羣的消費流水數據,畫像分析的內容主要是對當前分析客羣基本屬性如性別、年齡段、家庭結構,行爲屬性如消費水平、購物偏好時間、偏好品類等賦予客羣標籤,其他涉及到客羣價值發現,以及消費偏好間的關聯分析,只是用戶畫像的冰山一角,利用近期時間相對輕鬆好好整理一下,主要側重於用戶畫像探索的模型算法的選擇。

用戶畫像說明

  1. 分析方向
    用戶畫像一般用於刻畫用戶是什麼人,在什麼時間,做什麼事,對客戶進行用戶畫像包括兩個方面,對現存客戶與潛在客戶的刻畫:現存客戶是誰,客戶偏好,哪類客戶的價值最高等,進而對如何維繫客戶,提高客戶粘性與交易轉化率提供參考;潛在客戶是誰,客戶偏好,通過何種渠道可以找到他們,獲客成本等,瞭解如何挖掘潛在客戶。
  2. 數據維度
    數據維度越多,聯結的場景越豐富,畫像的質量自然越高,關鍵在於對數據本身的理解,以及對客戶意圖的揣摩,一般包括如下幾個維度:
    人口屬性:地域、年齡、性別、教育程度、職業、收入、生活習慣、消費習慣等;
    產品行爲:產品類別、活躍頻率、產品喜好、產品驅動、使用習慣、產品消費等;
    這些維度是依託不同場景靈活可變的,例如做商圈客羣分析中,產品指代就是包含各類品牌的商場,產品行爲可以是品牌偏好,消費頻次,消費時間段、消費金額等;
    網上找的一個案例圖:
    這裏寫圖片描述
    這裏寫圖片描述
  3. 數據來源
    從用戶畫像的分析方向可以看出數據來源可分爲三塊:用戶數據、產品數據、連接用戶與產品的渠道數據,以商場爲例,分別對應爲商場消費客戶、商場內商戶品牌,對於渠道數據在這個場景下似乎不太重要…
    用戶數據包括兩塊,靜態信息數據是指用戶的基本屬性信息,如性別、年齡、教育水平等等,是用戶自身的自然屬性,這塊的數據根據實際數據源的不同,若可直接獲取則只涉及數據清洗的工作,若不可直接獲取則需要針對數據建立適當的規則或模型推測基本屬性;動態信息數據是指是指用戶的行爲數據產生的標籤,如從消費行爲流水中獲取的消費水平,消費偏好等;
    產品數據也包括兩塊,產品自身的客觀屬性指產品價格、功能等,以及產品主觀屬性指產品風格、定位等;
    渠道數據包括用戶通過什麼途徑接觸產品,信息渠道和交易渠道;
    實際數據需要結合分析場景與可觸數據來決定。

用戶畫像相關模型選擇思路

  1. 用戶行爲標籤生成
    對用戶行爲進行模型構建的依據一般是基於用戶什麼時間,在什麼地點做了什麼事來進行標籤評定,一個用戶可能有多個標籤,但各個程度可能不同,用戶行爲標籤的粗略公式如下
    這裏寫圖片描述
  2. 客戶分羣
    通過用戶的多維度數據分析,對客戶進行分羣可以發掘不同羣體的行爲特徵,對不同特徵標籤的用戶進行針對性策略制定,例如尋找高價值客戶時,由其消費行爲進行分類,針對高價值人羣進行偏好針對性策略制定,則可以很好的增加該類客羣的粘度及交易成功率,在知乎上查看的一個作者寫的模型選擇的一個回答,覺得寫的很好,提供了一個客戶分羣選擇算法的一個思路:
    這裏寫圖片描述
  3. 基本屬性標籤
    基本屬性標籤並非可以直接獲取的,尤其是當前人們對於隱私保護的關注度提升,用戶基本屬性信息很多情況下是不可直接獲取的,想要獲取準確的用戶的年齡、性別、教育程度、家庭結構等基本都需要通過模型對其行爲數據進行處理,推測用戶基本屬性。這塊方法的選擇在很多時候沒有訓練數據的情況下,會採用指定規則來進行判定,類似於用戶分羣的普通分羣通過用戶歷史行爲特徵數據來進行推斷,也可採用聚類的方式探索。

模型及原理說明 ##–未完待續

  1. 經典RFM模型
    RFM是一個簡潔、有效的用戶分類方法,具有可解釋性強等優點。
    指標說明
    R(Recency):表示客戶最近一次消費時間距離當前時間間隔;
    F(Frequency):表示客戶指定時間段內消費頻次;
    M(Monentary):表示客戶指定時間段內消費總金額;
    數據處理
    數據指標梳理完之後,按照後續處理方式的不同,需要對數據進行標準化處理;
    用戶分類及客羣解釋
    用戶分類有兩種方式,閾值劃分或者採用聚類的方式,下圖中爲閾值劃分的方法,採用三個指標總體均值作爲閾值,對客羣進行分類:
    這裏寫圖片描述
    對客羣價值的劃分,有時候需要結合具體場景,對模型指標進行加權處理,進行排秩,獲取相對價值重要性。
  2. 基於rfm模型的客羣價值分類
    在1中rfm模型的基礎上,指標不變,在客戶分類中,可以採用多種聚類算法實現客戶分類,如k-means、svm、自組織映射模型(som)等,這裏的方法應該是多樣的,這裏主要想把som搞懂。
  3. 標籤權重定義
  4. 算法實現學習
    xgboost

參考文章的鏈接

參考鏈接1:知乎上對用戶畫像理解參考鏈接1
參考鏈接2:知乎上對用戶畫像理解參考鏈接2
參考鏈接3:百度的PR稿某種程度上揭示了現在市場上對“用戶畫像”的需求維度
參考鏈接4:客羣分類的作用與解析
參考鏈接5:基於TF-IDF算法打標籤
參考鏈接6:用戶畫像建模:方法與工具
參考鏈接7:基於tableau實現RFM模型案例
參考鏈接8:電商平臺-用戶畫像

最後吐槽一下csdn,太不靠譜了,是因爲改版嗎,我這篇內容已經梳理了兩個周了,竟然回到了最開始的樣子了,把自己已經寫過70%的內容重寫一遍有點難過,就(只)當(能)是幫助加深自己理解吧

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章