经过数十年的发展,语音识别和语音合成不再是一个新鲜的词汇,智能语音系统已经真正的走进了人们的生活,其产品及服务包括智能音箱、智能车载以及消费和互联网增值服务等多个方面。整个行业的市场需求在提示我们,语音识别有很极大的发展前景。
但同时,语音识别也面临着许多的挑战和机遇,比如降低语义的错误率,跨语种的语音识别,无限制人群的通用识别等等。
目前,越来越多的同学开始加入到语音识别的学习之中,但语音识别融合了数学与统计学、声学、语言学、计算机与人工智能等多个学科,对于工程师来说,系统地获取有关语音识别的资料和信息,尚有一定的难度。
为此,深蓝学院为大家准备了语音算法精品课程和《Kaldi语音识别实战》实体书,
免费领取
方式👇
☆ 语音识别算法:从GMM-HMM到端对端
☆ 嵌入式系统的搭建
☆ 说话人识别算法:从序列建模的角度
☆ 语音合成算法:从HTS到端到端
李先刚
语音语言技术部高级技术总监,北京大学博士,主要研究方向是语音识别、语音合成和说话人识别。
陈果果
约翰霍普金斯大学博士,清华大学本科,博士主要研究方向是语音识别以及关键词检索方向。
邹伟
滴滴语音识别和合成技术团队负责人,毕业于北京大学言语听觉研究中心,主要研究方向是语音识别、语音合成。
本书以目前流行的开源语音识别工具Kaldi为切入点,深入浅出地讲解了语音识别前沿的技术及它们的实践应用,是入门语音识别的必备书籍。
现0元包邮送哦~
本次活动参与即送4场语音大佬直播回放哦!
☆弱标注下的声音事件检测
讲师:王赟
Facebook人工智能应用研究组研究科学家,卡内基梅隆大学计算机学院语言技术研究所博士。
☆ 基于深度学习的多说话人分割聚类
讲师:张超
剑桥大学Research Associate,京东技术顾问,剑桥大学信息工程学博士,清华大学本硕。主要研究方向为语音和语言处理。
☆ 算法工程师求职沙龙—智能语音专场
现任京东数科语音算法工程师。本科和博士毕业于北京航空航天大学,研究方向包括语言识别,机器学习等。
讲师:吴本谷
硕士毕业于电子科技大学。研究方向包括语音识别,说话人识别。毕业先后在百度、北京猎户星空供职,主要负责各场景下语音识别声学模型优化,语言模型优化,声纹系统搭建等工作。
讲师:杨超
现任出门问问语音技术总监;本科和硕士毕业于西北工业大学,师从谢磊教授,研究方向为机器学习、自然语言处理和非参数贝叶斯模型。
讲师:张俊博
博士毕业于中国科学院声学研究所,师从颜永红老师,研究方向为语音识别和发音质量评测,著有出版物《Kaldi语音识别实战》。
☆端到端声源分离研究进展
讲师:罗艺
PhD student at Neural acoustic processing lab (Naplab) , Colubia University. My research interst is mainly about deep learning systems for audio front-end processing.
本文分享自微信公众号 - 音视频开发进阶(glumes_blog)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。