使用最大后验概率学习正态分布的参数

最近在看计算机视觉：模型学习与推理，第四章将了使用最大后验概率来学习正态分布的参数。

1维正态分布的先验概率是正态逆伽马分布，N维正态分布的先验概率是正态逆维系特分布。这里生成的数据是满足1维正态分布。

1维正态分布先验概率公式如下：
$\operatorname{Pr}\left(\mu, \sigma^{2}\right)=\frac{\sqrt{\gamma}}{\sigma \sqrt{2 \pi}} \frac{\beta^{\alpha}}{\Gamma(\alpha)}\left(\frac{1}{\sigma^{2}}\right)^{\alpha+1} \exp \left[-\frac{2 \beta+\gamma(\delta-\mu)^{2}}{2 \sigma^{2}}\right]$

最大后验概率实际上试求
$\begin{aligned} \hat{\mu}, \hat{\sigma}^{2} &=\underset{\mu, \sigma^{2}}{\operatorname{argmax}}\left[\prod_{i=1}^{I} \operatorname{Pr}\left(x_{i} | \mu, \sigma^{2}\right) \operatorname{Pr}\left(\mu, \sigma^{2}\right)\right] \\ &=\underset{\mu, \sigma^{2}}{\operatorname{argmax}}\left[\prod_{i=1}^{I} \operatorname{Norm}_{x_{i}}\left[\mu, \sigma^{2}\right] \operatorname{NormInvGam}_{\mu, \sigma^{2}}[\alpha, \beta, \gamma, \delta]\right] \end{aligned}$
的最大值。跟上文一样的方法，但是这个公式的形式稍微复杂。

$\hat{\mu}, \hat{\sigma}^{2}=\underset{\mu, \sigma^{2}}{\operatorname{argmax}}\left[\sum_{i=1}^{I} \log \left[\operatorname{Norm}_{x_{i}}\left[\mu, \sigma^{2}\right]\right]+\log \left[\text { NormInvGam }_{\mu, \sigma^{2}}[\alpha, \beta, \gamma, \delta]\right]\right]$

最终结果如下：

$\hat{\mu}=\frac{\sum_{i=1}^{I} x_{i}+\gamma \delta}{I+\gamma}$

$\hat{\sigma}^{2}=\frac{\sum_{i=1}^{I}\left(x_{i}-\hat{\mu}\right)^{2}+2 \beta+\gamma(\delta-\hat{\mu})^{2}}{I+3+2 \alpha}$

所以正态分布的参数依赖于超参数 $\alpha,\beta,\gamma,\delta$

算法流程如下：
$\begin{array}{l}{\text { Input : Training data }\left\{x_{i}\right\}_{i=1}^{I}, \text { Hyperparameters } \alpha, \beta, \gamma, \delta} \\ {\text { Output: MAP estimates of parameters } \theta=\left\{\mu, \sigma^{2}\right\}} \\ {\text { begin }} \\ {/ / \text { Set mean parameter }} \\ {\mu=\left(\sum_{i=1} x_{i}+\gamma \delta\right) /(I+\gamma)} \\ {/ / \text { Set variance }} \\ {\sigma^{2}=\left(\sum_{i=1}^{I}\left(x_{i}-\mu\right)^{2}+2 \beta+\gamma(\delta-\mu)^{2}\right) /(I+3+2 \alpha)} \\ {\text { end }}\end{array}$

生成数据的代码在
:代码链接点击这里.
实现代码如下：

void MAP_learning_univariate_normal_parameters() 
{

	double alpha, beta, gamma, delta; //hyperparameters α, β, γ > 0 and δ ∈ [−∞, ∞].

	//setting hyperparameters

	alpha = 1;
	beta = 1;
	gamma = 1;
	delta = -1;


	vector<double> data = generate_normal_distribution_data<double>(0, 1, 100000);

	double sum=0.0,sum_der_2=0.0;
	double mu_map, var_map;

	for (int i = 0; i < data.size(); i++)
	{
		sum += data[i];
	}

	mu_map = (sum + gamma * delta) / (data.size() + gamma);

	for (int i = 0; i < data.size(); i++)
	{
		sum_der_2 += ((data[i] - mu_map)*(data[i] - mu_map));
	}

	var_map = (sum_der_2 + 2 * beta + gamma * (delta - mu_map)*(delta - mu_map))/(data.size()+3+2*alpha);

	cout << "mu:" << mu_map << endl;
	cout << "var: " << var_map << endl;
}

决定精度的是超参数，我觉得有点玄学！！！
一般来讲先验概率准确率较低，加入数据之后计算的后验概率有明显的精度提升。而且数据量如果比较大
书中的一个事例图，讲的很清楚

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

使用最大后验概率学习正态分布的参数

使用最大似然策略學習正態分佈參數

基於分類分佈和正態分佈設計一個簡單分類器算法

基於最大後驗學習分類分佈參數

基於貝葉斯方法學習分類分佈參數

基於最大似然學習分類分佈參數

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結