Time-Delay Neural Network(TDNN)-下

前言

正文

  • 语音识别的小伙伴都知道,语音识别通常要把一段不等场的语音切分成等长的小段,通常是每小段长度为25ms,然后以小段为单位进行处理,即只考虑当前帧。Time-Delay顾名思义即在时间上会有延迟,具体一点是指在识别的时候当前帧不仅考虑自身,还要参考一定数量的前后帧。

  • TDNN具有以下特性:

    • 多层的feedforward NN及节点之间紧密的连接使得其可以表示复杂的非线性分类面;
    • Time-Delay使得其可以学习到特征之间的时序依赖;
    • 学习到的特征具有时移不变性,同一个音素出现在语音的不同位置学到的特征应该尽可能相近;
    • 学习过程中特征和标签不需要精确地对齐;
    • 参数数量应该远小于训练样本的数量;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章