【读书笔记】数学之美-笔记

本质就是一个编解码和传输的过程

自然语言处理在过去的30年发生了巨大的变化

构建两个词表，一个是基本词表，一个是复合词表，再根据两个词表分表建立两个语言模型：模型1，模型2，先对句子进行模型1分词，就得到了小颗粒度的分词结果，在此基础上，再用大颗粒度的模型2进行分词.

成功的解决了复杂的语音识别、机器翻译等问题

隐马尔科夫模型有两层，在语音识别上就表现为:
- 第一层是：一个词转到另外一个词的概率，这层是隐含的，【转换概率】
- 第二层是：拼音生成词语的概率【生成概率】
隐马尔科夫模型的两个必要算法
- 鲍姆-韦尔奇算法【训练算法】
- 维特比算法【解码算法】

信息的作用在于消除不确定性，自然语言处理的大量问题就是寻找相关的信息，来消除这些不确定性。

信息熵的物理含义是对一个信息系统不确定性的度量
互信息被广泛用于度量一些语言现象的相关性
相对熵也叫做交叉熵，也用来衡量相关性，但和变量的互信息不同，它用来衡量两个取值为正数的的函数的相关性
- 对于两个相同的函数，它的相对熵等于零
- 相对熵越大，两个函数的差异性也就越大
- 对于概率分布或者概率密度函数，如果取值均大于零，相对熵可以度量两个随机分布的差异性

将所有的关键字建立索引，关键字的背后为网页的链接，通过布尔运算（and，or，not），将要需要的结果提取出来，【计算机做布尔运算非常的迅速】

如果使用TF-IDF加上PageRank算法，那么给定一个查询，有关网页的综合排名大致由相关性和网页排名的乘积决定。

先帮助用户解决80%的问题，再慢慢解决剩下的20%的问题，是在工业界成功的秘诀之一，许多失败并不是因为人不优秀，而是做事情的方法不对，一开始追求大而全的解决方案，之后长时间不能完成，最后不了了之。