PRML 阅读笔记（十二）

原創

legend_xiang

2020-06-03 18:45

4.2 Probabilistic Generative Models

分类问题的生成模型：model p(x|ck),p(ck),再用Bayesian公式推导出p(ck|x)。对于“两类问题”，有：

其中a的定义如下：

其中有logistic function：

对K>2类分类问题，将logistic扩展到K类，即使用softmax function来解决。softmax的预测函数如下：

即对每一个分类K都要有一个相应的预测值，分母是为了保证概率之和为1。当K=2使，可以推导出softmax即logistic。在分类之前，还要对p(x|ck)和p(ck)建模，下面来看看当x分别为连续型变量和离散型变量时，不同的建模方法。

4.2.1 Continuous inputs

当x是连续型变量，我们假设x|ck服从多维高斯分布，并假设不同的类有相同的协方差矩阵。即有：

再利用上一小节介绍的关于后验概率和a的公式，可以得到：

当然这是假设K=2的情况下，且因为各个分类有相同的协方差矩阵，原本在似然函数中的x的二次项也消失了，注意到现在的决策面a仍然是x的线性函数，如果每个分类有不同的协方差矩阵的时候，那么二次项会在a中重新出现，模型就不再是线性模型了。当K>2的时候，上述过程是一样的。现在，在假设x|ck服从高斯分布的条件下，我们得到了后验概率的表达式，那么接下来的任务就是确定似然函数和先验概率中的参数了。

4.2.2 Maximum likelihood solution

假设先验概率p(c1)=π，我们可以得到似然函数：

分别对π，μ和协方差矩阵求偏导，得到参数的值，再反带回后验概率中进行接下来的预测即可。

4.2.3 Discrete features

每一个输入向量的分量，即每一个特征，假设取值为0或1。假设不同特征之间是相互独立的(即朴素贝叶斯假设)，假设对于每一个分类k，都有一个参数向量μK，μKi即在分类为K的条件下，第i个特征取1的概率，所以可以得到x|ck的分布：

乘以先验之后再对整个式子取对数得到似然函数，对似然函数的参数求偏导后得出参数值，再带回开始提到的a中，对接下来的输入进行预测即可。

4.2.4 Exponential family

这一节主要说明了假设x|ck属于比高斯分布更广泛的指数族分布时的一些性质，就不具体说了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

PRML 阅读笔记（十二）

PRML 閱讀筆記（四）

PRML 閱讀筆記（五）

PRML 閱讀筆記（一）

PRML 閱讀筆記（七）

PRML 閱讀筆記（十）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結