用戶畫像項目筆記1

項目立項
爲了更好更高效的管理、利用公司各條業務線產生的以及所需要的數據以更好地支撐公司主營業務以及其他各條業務線的運營
項目核心模塊
數據採集
數據預處理
數倉ETL系統
任務調度系統(azkaban|oozie)
元數據、數據治理系統(atlas)
數據可視化(javaee -> springboot+echarts)
項目整體架構
首先考慮數據來源
	行爲日誌
	業務數據
	廣告競價平臺數據
其次考慮技術選型, 業務建模
	數據採集: 日誌用flume, 業務數據用sqoop
	數據存儲: hdfs
	數據預處理: spark
	數據倉庫基礎設施: hive sparksql
	任務調度: crontab/ azkaban/ oozie

在這裏插入圖片描述

用戶畫像(刻畫人物特徵(比如徵信、分類、層級vip))

在這裏插入圖片描述
用戶畫像一點也不神祕,它是根據用戶在互聯網留下的種種數據,主動或被動地收集,最後加工成一系列的標籤。
用戶畫像可以理解爲業務層面的數據倉庫
刻畫用戶的各維度特徵(個性化), 特徵用標籤及權重來表達
標籤體系層級遞進關係: 原始數據-> 事實標籤 -> 模型標籤 -> 策略標籤(人工)

畫像用途
精準營銷: 這是運營最熟悉的玩法,從粗放式到精細化,將用戶羣體切割成更細的粒度(更個性化),輔以短信、推送、郵件、活動等手段,驅以關懷、挽回、激勵等策略
數據應用:用戶畫像是很多數據產品的基礎,諸如耳熟能詳的推薦系統、廣告投放系統。操作過各大廣告投放系統的同學想必都清楚,廣告投放基於一系列人口統計相關的標籤,性別、年齡、學歷、興趣偏好、手機等等。
用戶分析:(數據分析)雖然和Persona不一樣,profile也是瞭解用戶的必要補充。產品早期,PM們通過用戶調研和訪談的形式瞭解用戶。在產品用戶量擴大後,調研的效用降低,這時候會輔以用戶畫像配合研究。新增的用戶有什麼特徵,核心用戶的屬性是否變化等等。
數據分析:這個就不用多提了,用戶畫像可以理解爲業務層面的數據倉庫,各類標籤是多維分析的天然要素。數據查詢平臺會和這些數據打通。
深入理解用戶畫像
用戶流失概率標籤,流失概率 (樸素貝葉斯)(優於) 距今消費天數 (該問題在低頻場景更凸顯,旅遊APP,半年沒有活躍也是正常的)(優於) 流失標籤(事後結論分析)。
流失概率達到60%(閾值選擇)報警 , 執行挽回活動
不是我有了用戶畫像,便能驅動和提高業務。而是爲了驅動和提高業務,才需要用戶畫像。
用戶畫像的標籤一般通過兩種形式獲得:
基於已有數據或者一定規則統計加工,流失標籤和距今天數皆是。
另外一種是基於已有的數據計算概率模型,會用到機器學習和數據挖掘。
推而廣之,推薦系統也好,廣告系統也罷,它們有更復雜的維度、標籤、特徵,本質也是找出用戶最近想不想買車,用戶最近想不想旅遊。把最合適的信息在最恰當時機推給用戶,獲取最大的利益。
建立正確的用戶畫像
推出了APP專賣各式各樣的沙拉,現在需要建立用戶畫像指導運營。
公司現階段在業務層面,更關注營銷和銷售:如何將沙拉賣得更好。
  • 運營流程
    在這裏插入圖片描述
    • 用戶層級設計
      潛在、新客、老客的劃分
      RFM(近期購買行爲、購買的總體頻率、花了多少錢)模型是衡量客戶價值和客戶創利能力 然後分VIP等級
    • 人口統計屬性
      用戶地址
      不同屬性的人羣
      基本事實標籤 社會屬性 消費屬在這裏插入圖片描述
    • 用戶流失概率(模型標籤)
    • 行爲標籤(模型標籤)
      在這裏插入圖片描述
用戶畫像的標籤架構示例
具體的畫像得看產品形態:
像金融領域,還會有風險畫像,包括徵信、違約、洗錢、還款能力、保險黑名單等。
電商領域會有商品的類目偏好、品類偏好、品牌偏好,不一而足。
下單時間偏好: 可以將連續的時間離散化, 按不同時間段來統計

在這裏插入圖片描述

  • 從數據流向和加工看,用戶畫像包含上下級遞進關係。
    以上文的流失係數舉例,它依賴於用戶早期的歷史行爲。而用戶早期的歷史行爲,即10天內的消費金額、消費次數、登錄次數等,本身也是一個標籤,它們是通過原始的明細數據獲得。
    在這裏插入圖片描述
  • 好的用戶畫像系統,既是數據生態體系,也是業務和運營的生態體系,它是一門複雜的交叉領域。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章