基于时间加权的用户购买类目意愿计算

原創

2019-09-27 08:03

一、背景

在 DMP 的人群画像或者商品画像等的应用中，有一类常见的打分需求：旨在基于一些 transactions，为两种关系打上一个归一化的分数。比如基于一个用户的购买商品行为对该用户购买类目意愿打分，该文章讨论如何在考虑时间因素的情况下给用户打分。

二、要求

transaction 发生的时间越近，其所占的比重越大,且减小的速度越来越慢。
所有分数都需要正则化到 0-100 区间。

三、数据形式

输入的数据(表示某人某天买了某个类目多少单)：用户 id、日期、类目 id、订单数

最终产出数据：用户 id 对每个类目的购买意愿分

四、实现方式

1）要求 transaction 发生时间和现在的距离越小，这条记录越大，就像一个热门事件，会被人慢慢遗忘，且后续遗忘的速度越来越慢。

基于这个需求，很容易让人想到基于热力学的牛顿冷却定律：物体的冷却速度，与当前温度与室温之间的温差成正比。

换成数学语言表达：

其中H为室温，初始时刻的温度为：

其中α>0为与物体有关的常数,为负数表示当物体温度高于室温的时候，物体温度会下降，但当物体温度低于室温的时候会上升。

对于上个公式，两边取积分:

eg: 人体在死亡后，温度调节功能随即消失，由此正常温度(假设37)与室温比较，利用牛顿冷却定律可以获得死亡时间。

假设某冬天早上，接到报警，街头发现流浪汉尸体，6:30AM测量其体温为18度，到了7:30AM,其体温已经下降为16度。

预备知识完了，现在我们回到业务：假设transaction发生当天的热度为100度
而180天之前的transaction我们假设降为1度，又假设室温为0度，可以求出α：

2）对分数(上面的sum_score)做归一化。

假设对于sum_score,有最大值和最小值，如果差距过于大，会先对其做对数处理：

图像为:

该函数以原点为中心，将实数集映射到值（0，1）且两边都是开区间。我们希望通过平移和拉伸，对于上面的 [ -15,2 ] 的区间映射做映射：

符合要求，然后 0-1 的分数再乘以 100，将其转成 0-100 的归一分数。

本文转载自公众号有赞coder（ID：youzan_coder）。

原文链接：

https://mp.weixin.qq.com/s?__biz=MzAxOTY5MDMxNA==&mid=2455760033&idx=1&sn=cda32ddd58fea2a18e2d4ec9cb88f86b&chksm=8c686a84bb1fe39246da325ff19d7fdb66c947ee2ec061daf86e1f203d3e15f09eb3396e16f1&scene=27#wechat_redirect

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

基于时间加权的用户购买类目意愿计算

一、背景

二、要求

三、数据形式

四、实现方式

再谈23种设计模式（3）：行为型模式（学习笔记）

Power Automate Desktop 安装完，登录后老是提示one driver 错误

微前端学习笔记(4):从微前端到微模块之EMP与hel-micro方案探索

微前端学习笔记（1）：微前端总体架构概述，从微服务发微

985 硕士程序员，空窗 4 个月没有 Offer！

一文搞懂 Spring 循环依赖

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

VScode右键打开(添加到右键)

记一次 .NET某工控视觉自动化系统卡死分析

WindowsServer--SQL Server搭建主从同步实现读写分离 - 事务性分发

由南京大學發起的“DevOps·雲原生中國年度調查”，期待你的參與

基於時間加權的用戶購買類目意願計算

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結