声学模型学习笔记（七） advanced deep models

原創

xmucas

2020-02-20 15:53

multitask and transfer learning

multitask learning：不同的任务网络，可以共享一部分网络结构（比如说某个隐层）
transfer learning：迁移学习

SHL-MDNN

shared-hidden-layer multilingual DNN，用于训练不同语言的模型，所有的模型共享同一个隐层，输出层跟语言有关。
共用的隐层可以认为是一个特征提取器，最后的输出层为分类器。
SHL-MDNN需要多个语言同时进行训练，一个mini-batch包括多个语言的训练语料。
试验表明多语言训练出来的SHL-MDNN相比单语言训练出来的DNN性能有提升，共享的隐层训练在一定程度上面减弱了overfitting问题。
隐层作为特征提取器，可以把它对音素的区分性迁移到其他语言上面。
- 如果需要增加一种语言，只需要增加一个输出层，还是复用前面训练好的隐层，训练是固定隐层，只需要训练最后一层的参数即可
- 如果新增语言的训练数据比较充足，整体重新训练效果更好。
- 可以由英语迁移到中文，依然有效

RNN

RNN
LSTM

参考

《automatic speech recognition a deep learning approach》 chapter 12-15

xmucas

发布了132 篇原创文章 · 获赞 94 · 访问量 62万+

他的留言板关注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

声学模型学习笔记（七） advanced deep models

multitask and transfer learning

SHL-MDNN

RNN

参考

10分钟搞定Mysql主从部署配置

如何使用 JS 判断用户是否处于活跃状态

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

[转帖]

python列出centos7内存使用前50的进程信息

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

一键自动化博客发布工具,用过的人都说好(掘金篇)

lightdb数据库超时相关控制参数

lightdb秒级增加列和删除列（not null带默认值）

Java ThreadPoolShutdown

kaldi feature extraction

kaldi NFS/GlusterFS

kaldi 1d-CNN源碼

cuda 概況和安裝

kaldi 1d-CNN網絡結構

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結