推荐算法中点击率CTR修正方法—威尔逊区间

原創

2020-06-30 00:31

由于原始CTR计算方式只考虑了相对值，没有考虑绝对值。即，没有考虑曝光的数值大小，在曝光少的情况下，计算出的CTR其实不可靠，样本充足的情况下，才能反应真实情况

举例：

A：点击数 5 曝光数 10

B：点击数 50 曝光数 100

C：点击数 500 曝光数 1000

此三个广告的CTR 都是 0.5 ，但是按照实际表现，从置信的角度分析，应该是C > B > A，因为C的样本数更多，可信度更高。

为了衡量样本数对于 CTR 置信区间的影响，科学家们引入"威尔逊（Wilson）区间"的概念。公式如下

p：ctr
n：样本总数，即曝光数
z：正态分布里的参数

import numpy as np

def walson_ctr(num_click, num_pv, z=1.96):
    p = num_click * 1.0 / num_pv
    if p > 0.9:
        return 0.0
    
    n = num_pv
    
    A = p + z**2 / (2*n)
    B = np.sqrt(p * (1-p) / n + z**2 / (4*(n**2)))
    C = z * B
    
    D = 1 + z**2 / n

    ctr = (A - C) / D
    
    return ctr

结果：
walson_ctr(5,10)：0.2365895936154873
walson_ctr(50,100)：0.40382982859014716
walson_ctr(500,1000)：0.4690690341793595

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

###豪豪豪豪######2020 推荐系统技术演进趋势了解

讀知乎文章《推薦系統技術演進趨勢：從召回到排序再到重排》筆記：《推薦系統技術演進趨勢：從召回到排序再到重排》這篇文章主要說了下最近兩年，推薦系統技術的一些比較明顯的技術發展趨勢。主要從以下幾個方面介紹：推薦系統整體架構召回技術演進趨

2020-07-07 09:47:32

推荐系统之wide&deep

wide & deep 相信這是個對有關推薦系統工作者非常眼熟的一個模型，是16年穀歌應用於google play中的模型，在推薦系統中工業界的應用也非常廣泛，是一個比較成熟的模型，近日實習所在組上線這個模型，點擊率相比於LR得到了極大

2020-07-07 08:49:14

推荐系统过滤技术：基于内容的过滤及其利弊

在上一篇文章中，我們介紹了推薦系統的主要工作流程。在接下來的文章中，我們會詳細分析推薦系統中的過濾技術。推薦系統中不同的過濾技術推薦系統要想爲用戶提供切實有用的推薦服務，高效、準確的推薦技術至關重要，也就是說，理解不同推薦過濾

第四范式天枢

2020-07-01 22:52:09

翻译：用R实现序列模式挖掘进行商业推荐指南

在這份指南中，Allison Koenecke 揭示了當客戶增加Azure雲的服務時，微軟如何通過延伸傳統購物籃分析實現對消費者潛在服務需求的推薦。問題聲明： Market Basket Analys

2020-07-01 12:54:58

神经网络优化的方法-梯度、超参数

神經網絡優化方法一：使用正則化技巧提高模型的泛化能力二：梯度優化三：網絡初始化技巧和超參數調優一：使用正則化技巧提高模型的泛化能力常用的正則化方法如下所示： L1、L2 正則化 dropout 正則化 Data Augmen

2020-06-30 00:31:24

论文笔记《Item-Based Collaborative Filtering Recommendation Algorithms》

一、基本信息論文題目：《Item-Based Collaborative Filtering Recommendation Algorithms》發表期刊及年份：WWW 2001 二、摘要近幾年由於可獲得信息的大量增長和訪問

帅气的小峰

2020-06-29 23:43:02

####haohaohaohao#####爱奇艺个性化推荐排序实践

作者｜Michael 作者介紹 Michael，推薦算法助理研究員，2014年碩士畢業於北京郵電大學後加入愛奇藝。從事推薦算法的研發和管理工作，對於機器學習和深度學習在推薦上的應用有着豐富的經驗。請輸入標題 abcdefg 導

2020-06-27 22:22:20

###好好好##知识图谱与推荐系统

文章目錄知識圖譜與個性化推薦 1、推薦系統的任務和難點 2、知識圖譜的優勢 3、知識圖譜與推薦系統的結合方法 3.1 基於特徵的推薦方法

2020-06-27 22:22:18

pandas2libFFM

import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) from sklear

猪逻辑公园

2020-06-27 22:06:46

NLP 神经网络训练慎用 Adam 优化器

https://www.jianshu.com/p/48e71b72ca67 NLP 神經網絡訓練慎用 Adam 優化器 theoqian關注 12019.02.10 16:01:45字數 499閱讀 1,168 AllenNL

2020-06-25 15:12:03

推荐系统（一）最通俗易懂的协同过滤算法（CF）

協同過濾算法是典型的基於領域的算法，具體來說協同過濾算法分爲兩種，基於用戶的協同過濾算法和基於物品的協同過濾算法。一.基於用戶的協同過濾算法算法步驟： 1.找到和目標用戶興趣相似的用戶集合 2.找到這個用戶集合中用戶喜歡的，而

2020-06-25 14:33:55

关于推荐系统中评分预测和TOP-N推荐问题的理解

最近在寫畢業論文時，發現自己對推薦系統中的評分預測和TOP-N推薦問題理解的不夠深入，遂查閱資料，在此記錄下自己對這一問題的一點理解。首先說結論，評分預測和TOP-N推薦是推薦系統應用的兩大場景，二者之間沒有必然的聯繫。下面分別對

2020-06-25 08:04:50

推荐算法总结（召回+排序+工程化）

文章目錄召回內容召回word2vecLDA行爲召回ItemCFUserCFSwing關聯規則聚類協同矩陣分解隱語義LFM圖召回PersonalRank圖嵌入圖神經網絡模型召回item2vec（embedding）FM模型召回雙塔模

2020-06-24 01:16:56

用矩阵分解来解决推荐问题

文章目錄整體架構分部細節生成訓練數據bm25矩陣分解lightfm 整體架構讀取數據訓練模型分部細節生成訓練數據從hadoop生成兩個子文件（1）docid，pv，cl （2）mid，cl_docid_durati

2020-06-24 01:16:56

推荐算法知识梳理

文章目錄架構介紹推薦系統架構介紹召回簡單介紹非個性化召回多路召回模型召回雙塔模型因子分解發散點用戶行爲序列召回改進用戶多興趣拆分知識圖譜融合召回圖神經網絡模型召回排序技術發展趨勢模型表達能力顯示特徵組合特徵抽取器的進化AutoML

2020-06-24 01:16:56

24小時熱門文章

Python 潮流周刊#52：Python 处理 Excel 的资源

最新文章

最新評論文章