PRML 阅读笔记（十三）

原創

2020-06-03 18:45

4.3 Probabilistic Discriminative Models

这一节中，介绍直接对p(ck|x)建模的判别模型对x进行分类。直接对p(ck|x)进行建模所要拟合的参数要比生成模型少很多，另外当对x|ck的分布假设不太靠谱的时候，生成模型的效果也会很差。

4.3.1 Fixed basis functions

之前讨论的算法多是在wx+w0的情况下，但这些算法对于对x做一些非线性变化之后仍然适用，而使用这样的非线性变化也有很多的局限性。

4.3.2 Logistic Regression

根据logistic function直接对C|phi(x)进行建模，有：

明显的，参数要比生成模型少了很多。可以得到似然函数：

对其取log形式，再取一个符号，最大似然变error function，即我们要最小化的目标，对error function求关于w的偏导数，得到了与最小二乘一样的update rule。然而，这个update rule和最小二乘不同，概率解释就不一样，而且其中的yn，一个是w*phi，另一个则是logistic function。

下面作者又批评了最大似然的方法，好像是说当w->无穷的时候，最大死然只有加入了正则项或者利用MAP才能避免logistic称为heaviside的情况，不知道这个w->无穷是哪来的，最后一段看的不是特别明白。

4.3.3 Iterative reweighted least squares

这一节其实主要是阐述了用Newton方法更新w。

4.3.4 Multiclass logistic regression

扩展logistic到K>2,即softmax。

4.3.5 Probit Regression

4.3.6 Canonical link functions

4.3.5开始论述x|ck不取指数族分布这样的简单分布了，而是开始取高斯混合分布等比较复杂的分布。4.4，4.5是Bayesian观点下的分类模型，这两部分，10页的内容也暂且留下，需要复习一些其它东西，等回过头来再看的时候再补上。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

What is the Best Multi-Stage Architecture for Object Recognition?

Deep Learning論文筆記之（六）Multi-Stage多級架構分析 [email protected] http://blog.csdn.net/zouxy09 自己平時看了一些論文，但老感覺看完過

2020-07-04 16:59:32

论文笔记之Structural Deep Network Embedding

本論文是kdd2016的一篇論文主要的目的也是做node embedding。主要的想法就是通過deep autoencode對node進行embedding，不過在在embedding的時候不僅考慮了1-hop的信息而且考慮

2020-07-08 10:23:34

神经网络动量因子

其中動量係數一般取（0,1），直觀上理解就是要是當前梯度方向與前一步的梯度方向一樣，那麼就增加這一步的權值更新，要是不一樣就減少更新。更詳細的介紹參見《DeepLearning最優化方法之Momentum（動量）》

2020-07-08 10:23:34

Deep Learning 之参数初始化

本文僅對常見的參數初始化方法進行總結（大部分內容來自deep learning一書），原理性的問題不進行過多的探討。 Deep Learning中參數初始化十分重要，一般來說有以下這些原因： 1.初始點的選取，有時候能夠決定算法

2020-07-08 10:23:34

BERT预训练模型的演进过程！(附代码)

文章目錄1. 什麼是BERT2. 從Word Embedding到Bert模型的發展2.1 圖像的預訓練2.2 Word Embedding2.3 ELMO2.4 GPT2.5 BERT2.5.1 Embedding2.5.2 M

2020-07-07 14:42:00

Transformer各层网络结构详解！面试必备！(附代码实现)

文章目錄1. 什麼是Transformer2. Transformer結構2.1 總體結構2.2 Encoder層結構2.2.1 Positional Encoding2.2.2 Self-Attention2.2.3 Multi

2020-07-07 14:42:00

XLNet预训练模型，看这篇就够了！(代码实现)

文章目錄1. 什麼是XLNet2. 自迴歸語言模型（Autoregressive LM）3. 自編碼語言模型（Autoencoder LM）4. XLNet模型4.1 排列語言建模（Permutation Language Mod

2020-07-07 14:41:58

seq2seq通俗理解----编码器和解码器(TensorFlow实现)

文章目錄1. 什麼是seq2seq2. 編碼器3. 解碼器4. 訓練模型5. seq2seq模型預測5.1 貪婪搜索5.2 窮舉搜索5.3 束搜索6. Bleu得分7. 代碼實現8. 參考文獻 1. 什麼是seq2seq 在⾃然語

2020-07-07 14:41:58

【Model Log】模型评估指标可视化，自动画Loss、Accuracy曲线图工具，无需人工参与!

文章目錄1. Model Log 介紹2. Model Log 特性3. Model Log 演示地址4. Model Log 安裝5. Model Log 使用5.1 啓動 web 端5.2 Model Log API使用5.3

2020-07-07 14:41:56

OpenCV学习教程入门篇

OpenCV，是Inter公司開發的免費開源專門由於圖像處理和機器視覺的C/C++庫，英文全稱是Open Source Computer Vision。 1. 可視化語言Matlab與OpenCV都可以用於圖像處理，學哪種比較好

2020-07-07 04:51:46

NLP笔记 CS224n（1）—— 词向量

詞向量 NLP 處理文本，所以在進行處理之前，要先解決文本的表示。文本由詞組成，本文討論了表示詞彙的幾種方案。 WordNet 這種方法基於如下思想：用詞彙的意義來代表詞。所以我們可以建立若干個集合，每個集合代表一組同義詞，每個詞

是不是测评机针对我

2020-07-06 12:37:25

NLP笔记 CS224n （2） —— 词向量与词传感器

傳送門 Word2Vec Optimization 梯度下降，隨機梯度下降。實質上是無監督學習，每個batch的最小單位可以是一組word2word的映射，輸入值是一箇中心詞，輸出值是一個其對應的outside詞，要學習是從中心

是不是测评机针对我

2020-07-06 12:37:24

自动微分(Automatic Differentiation)

目錄什麼是自動微分手動求解法數值微分法符號微分法自動微分法自動微分Forward Mode 自動微分Reverse Mode 參考引用現代深度學習系統中（比如MXNet， TensorFlow等）都用到了一種技術——自動微分

2020-07-05 23:45:02

词向量 — word2vec

自然語言是一套用來表達含義的複雜系統。在這套系統中，詞是表義的基本單元。在機器學習中，如何使用向量表示詞？顧名思義，詞向量是用來表示詞的向量，通常也被認爲是詞的特徵向量。近年來，詞向量已逐漸成爲自然語言處理的基礎知識。爲

2020-07-04 09:16:03

Pytorch实现一个用于学习正态分布的GAN网络

2014 年，Ian Goodfellow 和他在蒙特利爾大學的同事發表了一篇震撼學界的論文《Generative Adversarial Nets》，這標誌着生成對抗網絡（GAN）的誕生，而這是通過對計算圖和博弈論的創新

2020-07-04 09:16:03

24小時熱門文章

最新文章

最新評論文章