先验概率后验概率

  最近研究序列标注就学习一下条件随机场然后看到推荐的贝叶斯然后看到"先验概率,后验概率"的概念.其实并不是很重要,很早以前也了解过,但是想着既然看到了就理解彻底吧.

  很多博客大多是给两句官方解释加个例子,就是捅不开那层窗户纸,最后发现大家都是抄的百度百科的解释,但是解释很抽象,那我记录一下自己的领悟以供复习.

百度百科"后验概率"的简介中原话:

"事情还没有发生,要求这件事情发生的可能性的大小,是先验概率。事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,是后验概率。"

个人理解:

所谓的"事情没有发生"的意思就是我们要计算的这件事情在理想状态下,按以往事件正常发生的数据来统计频率计算得到的概率,主观上也会认为这种统计的概率就是事件的概率,比如抛硬币,落地正面朝上的概率就是0.5,这是先验概率

而后面的"事情已经发生"的意思是我们要计算的这件事已经发生了,但是我们发现它并不是在理想状态下发生的,是有一些因素或条件影响了它,那么我们的先验概率就不准确了,而在这种真实的"不理想"或者有干扰的情况下发生的概率就是后验概率.比如抛硬币,我们限制抛起时正面朝上抛起,在这种条件下落地正面朝上的概率就是后验概率.也是条件概率.

百度百科"后验概率"的简介中原话:

"后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的"果"。先验概率与后验概率有不可分割的联系,后验概率的计算要以先验概率为基础"

个人理解:

"重新修正的概率"是什么意思,因为我们认为的概率是根据历史数据得到的理想状态下的概率(先验概率),但是当事情发生后我们发现事情发生的概率不是我们早先认为的概率(这也是"执果寻因"中的"果",事情发生的概率结果和我们想的不一样,那就要寻找原因了),所以找到影响因素后,就要计算或统计这种真实因素影响下事件发生的概率,这种概率是准确的,所以说是对原来概率(先验概率)的修正

百度百科"后验概率"的简介中原话:

"先验概率不是根据有关自然状态的全部资料测定的,而只是利用现有的材料(主要是历史资料)计算的;后验概率使用了有关自然状态更加全面的资料,既有先验概率资料,也有补充资料;"

个人理解:

全部资料就是全部数据的意思,先验概率只是根据历史数据进行计算的,当然不够准确,而后验概率是根据当前事件真实的结果回溯事件发生时的影响因素,得到的概率,当然比之前的想当然更准确.

用神经网络来举例: 第1个epoch中,第9个batch数据传进去计算损失值反向传播参数进行更新后, 先验概率就是对第下一个batch的数据来说当前各个参数下对结果数据的预测,这里的下一个batch数据是理想中的类似前面9个batch的数据,根据历史经验得到的结果,然而第10个batch中的数据并不同与前面的数据,会有新的影响因素出现,就需要对各参数做更新,这种更新就需要考虑到新的因素出现的情况下得到某结果的概率,这种概率,这就是后验概率,这里的先验后验相对的事件就是第10个batch的数据.

越解释越抽象,还是多看博客吧,看多了就顿悟了.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章