用戶畫像如何驗證正確性?

前言

最近在用戶畫像任務中有個迷茫點,通過從用戶行爲或者用戶數據中爲用戶量身定製的標籤到底準不準確呢?之前對用戶畫像的初步瞭解寫過一篇博客,其中對畫像的驗證主要基於模型的線上線下評估。然而,在實際的業務中大多數是依靠業務人員或者分析人員的經驗去看待,有很多驗證方法又不一定適用實際的業務場景,所以在網上一番搜索後在驗證思路上有了一些起色,同時也想把這些內容做些分享,也希望在這個方向上有更多的交流。

用戶畫像大體流程

用戶畫像前期探索
用戶畫像數據整理&分析&標籤設計
用戶畫像原型設計
用戶畫像開發
用戶畫像上線
用戶畫像更新

用戶畫像建設大體的流程如上圖所示,其中較爲細節的內容還是結合實際的業務內容,下面針對用戶畫像的驗證主要還是集中在用戶畫像開發和用戶畫像更新的節點上。

用戶畫像分類

以下僅僅是較爲粗略地分類
在這裏插入圖片描述

用戶畫像驗證

1.畫像開發過程中驗證

(1)模型驗證
此方法較多用於基礎信息以及基於用戶行爲的用戶畫像,在用戶標籤例如性別、年齡等能夠有相應的標註or真實結果時可以使用,通用的驗證指標爲AUC、KS、ROC、Confusion Matrix等。

(2)抽樣驗證
在用戶量較大的前提下,可以採用隨機抽樣或者分層抽樣的方式進行驗證。

(3)交叉驗證
交叉驗證分畫像指標間的交叉驗證及外部數據的補充交叉驗證,外部數據例如第三方機構等。

2.畫像上線後驗證

(1)真實數據驗證
隨着業務發展,一些用戶畫像信息會從無到有慢慢積累,毋庸置疑的是,將真實數據用於驗證畫像類指標是最準確的。

(2)A/B Test
A/B Test 是互聯網公司最常用的驗證方法,一般基於用戶畫像制定的策略在上線時都會進行嚴格的對比試驗,以測試畫像的準確性。

小思考

在實際業務場景中還是存在有難以驗證的用戶標籤,與其一味的追求單個個體的標籤正確性,更應該將精力置於標籤上線後對實際業務的效果評估上,以業務效果來評定標籤的有效性個人覺得可能更適用一些,從效果上也能一定程度地反映標籤有無或者標籤算法是否存在不同。

參考資料:https://www.zhihu.com/question/36422121/answer/207069948

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章