用户画像分析相关整理

原創

2018-08-27 13:17

前期做了一些用户画像的数据支持工作，都是哪里需要往哪搬，没有进行过系统的总结，总归不是自己的东西，只知道要这么做，却不知为何要这么做，所以在这里进行一个归纳总结。
用户画像一般用于研究当前客户需求以及挖掘潜在客户，用户画像需要结合具体的场景进行分析，不同场景下分析也是存在差异的，自己工作中接触的数据主要为目标客群的消费流水数据，画像分析的内容主要是对当前分析客群基本属性如性别、年龄段、家庭结构，行为属性如消费水平、购物偏好时间、偏好品类等赋予客群标签，其他涉及到客群价值发现，以及消费偏好间的关联分析，只是用户画像的冰山一角，利用近期时间相对轻松好好整理一下，主要侧重于用户画像探索的模型算法的选择。

用户画像说明

分析方向
用户画像一般用于刻画用户是什么人，在什么时间，做什么事，对客户进行用户画像包括两个方面，对现存客户与潜在客户的刻画：现存客户是谁，客户偏好，哪类客户的价值最高等，进而对如何维系客户，提高客户粘性与交易转化率提供参考；潜在客户是谁，客户偏好，通过何种渠道可以找到他们，获客成本等，了解如何挖掘潜在客户。
数据维度
数据维度越多，联结的场景越丰富，画像的质量自然越高，关键在于对数据本身的理解，以及对客户意图的揣摩，一般包括如下几个维度：
人口属性：地域、年龄、性别、教育程度、职业、收入、生活习惯、消费习惯等；
产品行为：产品类别、活跃频率、产品喜好、产品驱动、使用习惯、产品消费等；
这些维度是依托不同场景灵活可变的，例如做商圈客群分析中，产品指代就是包含各类品牌的商场，产品行为可以是品牌偏好，消费频次，消费时间段、消费金额等；
网上找的一个案例图：
数据来源
从用户画像的分析方向可以看出数据来源可分为三块：用户数据、产品数据、连接用户与产品的渠道数据，以商场为例，分别对应为商场消费客户、商场内商户品牌，对于渠道数据在这个场景下似乎不太重要…
用户数据包括两块，静态信息数据是指用户的基本属性信息，如性别、年龄、教育水平等等，是用户自身的自然属性，这块的数据根据实际数据源的不同，若可直接获取则只涉及数据清洗的工作，若不可直接获取则需要针对数据建立适当的规则或模型推测基本属性；动态信息数据是指是指用户的行为数据产生的标签，如从消费行为流水中获取的消费水平，消费偏好等；
产品数据也包括两块，产品自身的客观属性指产品价格、功能等，以及产品主观属性指产品风格、定位等；
渠道数据包括用户通过什么途径接触产品，信息渠道和交易渠道；
实际数据需要结合分析场景与可触数据来决定。

用户画像相关模型选择思路

用户行为标签生成
对用户行为进行模型构建的依据一般是基于用户什么时间，在什么地点做了什么事来进行标签评定，一个用户可能有多个标签，但各个程度可能不同，用户行为标签的粗略公式如下
客户分群
通过用户的多维度数据分析，对客户进行分群可以发掘不同群体的行为特征，对不同特征标签的用户进行针对性策略制定，例如寻找高价值客户时，由其消费行为进行分类，针对高价值人群进行偏好针对性策略制定，则可以很好的增加该类客群的粘度及交易成功率，在知乎上查看的一个作者写的模型选择的一个回答，觉得写的很好，提供了一个客户分群选择算法的一个思路：
基本属性标签
基本属性标签并非可以直接获取的，尤其是当前人们对于隐私保护的关注度提升，用户基本属性信息很多情况下是不可直接获取的，想要获取准确的用户的年龄、性别、教育程度、家庭结构等基本都需要通过模型对其行为数据进行处理，推测用户基本属性。这块方法的选择在很多时候没有训练数据的情况下，会采用指定规则来进行判定，类似于用户分群的普通分群通过用户历史行为特征数据来进行推断，也可采用聚类的方式探索。

模型及原理说明 ##–未完待续

经典RFM模型
RFM是一个简洁、有效的用户分类方法,具有可解释性强等优点。
指标说明
R(Recency):表示客户最近一次消费时间距离当前时间间隔；
F(Frequency):表示客户指定时间段内消费频次；
M(Monentary):表示客户指定时间段内消费总金额；
数据处理
数据指标梳理完之后，按照后续处理方式的不同，需要对数据进行标准化处理；
用户分类及客群解释
用户分类有两种方式，阈值划分或者采用聚类的方式，下图中为阈值划分的方法，采用三个指标总体均值作为阈值，对客群进行分类：

对客群价值的划分，有时候需要结合具体场景，对模型指标进行加权处理，进行排秩，获取相对价值重要性。
基于rfm模型的客群价值分类
在1中rfm模型的基础上，指标不变，在客户分类中，可以采用多种聚类算法实现客户分类，如k-means、svm、自组织映射模型（som）等，这里的方法应该是多样的，这里主要想把som搞懂。
标签权重定义
算法实现学习
xgboost

参考文章的链接

参考链接1：知乎上对用户画像理解参考链接1
参考链接2：知乎上对用户画像理解参考链接2
参考链接3：百度的PR稿某种程度上揭示了现在市场上对“用户画像”的需求维度
参考链接4：客群分类的作用与解析
参考链接5：基于TF-IDF算法打标签
参考链接6：用户画像建模：方法与工具
参考链接7：基于tableau实现RFM模型案例
参考链接8：电商平台-用户画像

最后吐槽一下csdn，太不靠谱了，是因为改版吗，我这篇内容已经梳理了两个周了，竟然回到了最开始的样子了，把自己已经写过70%的内容重写一遍有点难过，就（只）当（能）是帮助加深自己理解吧

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

用户画像分析相关整理

用户画像说明

用户画像相关模型选择思路

模型及原理说明 ##–未完待续

参考文章的链接

钉钉打卡速度慢

Nginx R31 doc 官方文档-01-nginx 如何安装

Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜

挑战程序设计竞赛 2.2章习题 POJ - 3617 Best Cow Line 贪心

字节面试：MySQL什么时候锁表？如何防止锁表？

.NET8连接SQL SERVER 2008 R2 报：证书链是由不受信任的颁发机构颁发的

golang开发环境搭建(win10)

python计算机视觉学习笔记——PIL库的用法

Golang初学：获取程序内存使用情况，std runtime

冷卻算法綜合排名改進模型-R實現代碼

LTSM循環神經網絡過程原理梳理

時常用到linux命令及其他雜七雜八命令

python單頁面簡單爬蟲實例--百度風雲榜

排行模型驗證的方式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結