假设检验——小解转化率A\B试验

原創

等风来ing

2020-06-25 04:35

目前学习了解假设检验中，学的不是很透彻，所以仅根据 A/B-test显著性检验讲一讲转化率类型的假设检验。

一、伯努利分布

一次实验，两种结果，就是伯努利试验。

伯努利分布_百度百科

抛一次硬币，结果为正面为事件A，则P(A)的期望和方差分别为1/2，1/4，即p和p(1-p)

二、二项式分布

重复n此的伯努利试验，就是二项式分布，重点是独立同分布，没什么好说的。

二项式分布_百度百科

抛n次硬币，结果为正面的次数为事件A，则P(A)的期望和方差分别为np和np(1-p)。n=1时就是伯努利分布。

三、n值很大时的二项式分布

中心极限定理_百度百科

棣莫弗-拉普拉斯中心极限定理就已经适用了，大意就是n很大时，二项式分布B~(n,p)近似于正态分布Z~(np,np(1-p))

中心极限定理描述的某种分布的随机变量之和的分布，也就是n重伯努利试验出现正面的总数的分布，也就是二项式分布。

想了解更多中心极限定理看这个大数定理与中心极限定理

四、转化率与二项式分布

从A页面到B页面，结果只有两种，要么到要么不到。一个用户到不到B页面即是伯努利试验。假定每个用户到不到B页面是独立同分布的，那么n个用户有多少个到B页面即是二项式分布，当n很大时，近似于正态分布。

n个用户有k个到了B页面，k/n就是转化率。k满足Z~(np,np(1-p))，按照正态分布的特性，k/n也就满足

Z~(np/n,np(1-p)/n^2)=(p,p(1-p)/n)。p也就是每个用户访问B页面的概率，我们可以用样本的k/n也就是转化率作为p的无偏估计

五、假设检验

我们有一个可能会影响转化率的策略S，我们想用假设检验验证S的效果。

那么就将用户随机分为两组（一般都是第一个用户适用A第二个就适用B，依此类推。），对A组用户用策略S，B组保持原样作为对照组。

由于我们要验证的是有策略S的A组是不是比B组好，所以选用单侧假设检验。

H0：PA-PB<=0 H1 PA-PB>0

然后确立显著性水平，一般都是5%，单侧就是1.64倍标准差。

我们已经知道了PA、PB也就是A组、B组的转化率都是满足正态分布的，根据正态分布的性质，

PA-PB也满足正态分布Z~(μ1-μ2，σ1^2+σ2^2)也就是（p1-p2,p1(1-p1)/n1+p2(1-p2)/n2）。

那么就可以根据两组的样本量n和到达下个页面的数量k，算出p。

然后算PA-PB再标准正态化，得到的值和1.64比较，如果大于1.64，也就是小概率事件发生了拒绝原假设，备择假设为真。

六、置信区间

仅仅给出是否显著的结论，其实也是不恰当的。

最好能加上置信区间。如果一个试验，尽管显著，但方差大，置信区间特别宽，那么试验结果也不是很可信，随机性太大。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

假设检验——小解转化率A\B试验

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU启动那些事（12.A）- uSDHC eMMC启动时间(RT1170)

GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

企业大模型如何成为自己数据的“百科全书”？

本地SSL证书过期输入命令在IIS自动生成

基于Ubuntu-22.04安装K8s-v1.28.2实验（二）使用kube-vip实现集群VIP访问

.NET周刊【5月第2期 2024-05-12】

【算法】各類排序算法Python簡單實現

假設檢驗——小解轉化率A\B試驗

Python 可迭代對象、迭代器、生成器概念理解

Python BeautifulSoup爬取鏈家租房信息

小解假設檢驗

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結