用戶畫像學習筆記

一 用戶畫像簡介

 

• 用戶畫像,即用戶信息標籤化,通過收集用戶社會屬性、消費習慣、偏好特徵等各個維度數據,進而對用戶或者產品特徵屬性的刻畫,並對這些特徵分析統計挖掘潛在價值信息,從而抽象出一個用戶的信息全貌;

• 可看做是企業應用大數據的根基,是定向廣告投放與個性化推薦的前置條件,爲數據驅動運營奠定了基礎。如何從海量數據中挖掘出有價值的信息已經愈發重要。

 

 

二 用戶畫像的主要模塊

以用戶端的表單填寫、消費、瀏覽、搜索等相關操作行爲數據作爲輸入,通過數據建模、開發、產品化,幫助企業認知、瞭解用戶、客觀瞭解自己的產品,輸出到用戶端進而提供個性化的產品、服務和營銷方案做好一套能真正賦能於業務,產生落地價值的用戶畫像繞不開下面的8個主要模塊。

三 用戶畫像的標籤類型

用戶畫像建模其實就是對用戶進行打標籤,從對用戶打標籤的方式來看,一般分爲三種類型:1、基於統計類的標籤;

2、基於規則類的標籤、

3、基於挖掘類的標籤。

 

下面我們介紹這三種類型標籤的區別:

 

1. 統計類標籤:

這類標籤是最爲基礎也最爲常見的標籤類型,例如對於某個用戶來說,他的性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數、近7日活躍次數等字段可以從用戶註冊數據、用戶訪問、消費類數據中統計得出。該類標籤構成了用戶畫像的基礎;

 

2. 規則類標籤:

該類標籤基於用戶行爲及確定的規則產生。例如對平臺上“消費活躍”用戶這一口徑的定義爲近30天交易次數>=2。在實際開發畫像的過程中,由於運營人員對業務更爲熟悉、而數據人員對數據的結構、分佈、特徵更爲熟悉,因此規則類標籤的規則確定由運營人員和數據人員共同協商確定;(同時需要藉助數據調研)

 

3. 機器學習挖掘類標籤:

該類標籤通過數據挖掘產生,應用在對用戶的某些屬性或某些行爲進行預測判斷。例如根據一個用戶的行爲習慣判斷該用戶是男性還是女性,根據一個用戶的消費習慣判斷其對某商品的偏好程度。該類標籤需要通過算法挖掘產生。

 

在項目工程實踐中,一般統計類和規則類的標籤即可以滿足應用需求,開發中佔有較大比例。機器學習挖掘類標籤多用於預測場景,如判斷用戶性別是男是女,判斷用戶購買商品偏好、判斷用戶流失意向等。一般地機器學習標籤開發週期較長,耗費開發成本較大,因此其開發所佔比例較小。

四 畫像規劃和數據架構——開發流程

 

第一階段:目標解讀

在建立用戶畫像前,首先需要明確用戶畫像服務於企業的對象,根據業務方需求,未來產品建設目標和用戶畫像分析之後預期效果;

 

第二階段:任務分解與需求調研

經過第一階段的需求調研和目標解讀,我們已經明確了用戶畫像的服務對象與應用場景,接下來需要針對服務對象的需求側重點,結合產品現有業務體系和“數據字典”規約實體和標籤之間的關聯關係,明確分析緯度;

 

第三階段:需求場景討論與明確

在本階段,數據運營人員需要根據前面與需求方的溝通結果,輸出《產品用戶畫像需求文檔》,在該文檔中明確畫像應用場景、最終開發出的標籤內容與應用方式 ,並就該份文檔與需求方反覆溝通確認無誤。

 

第四階段:應用場景與數據口徑確認

經過第三個階段明確了需求場景與最終實現的標籤緯度、標籤類型後,數據運營人員需要結合業務與數據倉庫中已有的相關表,明確與各業務場景相關的數據口徑。在該階段中,數據運營方需要輸出《產品用戶畫像實施文檔》,該文檔需要明確應用場景、標籤開發的模型、涉及到的數據庫與表,應用實施流程;

 

第五階段:特徵選取與模型數據落表

本階段中數據分析挖掘人員需要根據前面明確的需求場景進行業務建模,寫好HQL邏輯,將相應的模型邏輯寫入臨時表中,抽取數據校驗是否符合業務場景需求。

 

第六階段:線下模型數據驗收與測試

數據倉庫團隊的人員將相關數據落表後,設置定時調度任務,進行定期增量更新數據。數據運營人員需要驗收數倉加工的HQL邏輯是否符合需求,根據業務需求抽取查看錶中數據範圍是否在合理範圍內,如果發現問題及時反饋給數據倉庫人員調整代碼邏輯和行爲權重的數值。

 

第七階段:線上模型發佈與效果追蹤

經過第六階段,數據通過驗收之後,就可以將數據接口給到搜索、或技術團隊部署上線了。上線後通過對用戶點擊轉化行爲的持續追蹤,調整優化模型及相關權重配置。

 

五 畫像規劃和數據架構——數倉架構

 

 

六 數據指標體系

需要開發的畫像標籤從大類上可劃分爲用戶人口屬性標籤、用戶行爲標籤、風險控制維度標籤,進一步細分的話可在這兩個畫像基礎上開發出用戶偏好畫像和羣體屬性、羣體偏好畫像等。

6.1 屬性類標籤

屬性類指標按常見一級、二級標籤劃分可以劃分出很多,這裏只給出一些示例…

 

 

6.2 行爲類標籤

行爲類指標按常見一級、二級標籤劃分可以劃分出很多,需根據具體業務決定,

 

用戶行爲標籤畫像

用戶偏好畫像

用戶登錄活躍信息

 

6.3 風險控制類標籤

風控類指標按常見一級、二級標籤劃分可以劃分出很多

風險控制類標籤有多應用場景:

• 客服人員根據一些用戶是否高退貨、高投訴、高價值等特徵標籤,採用不同的話術;

• 售後運營人員根據用戶是否高退貨、惡意刷單、連續拒簽收等標籤採用不同的運營措施

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章