2018AI開發者大會:推進語音事業發展,標貝科技首次免費開放TTS數據庫

2018年11月8至11日,由中國IT社區CSDN與硅谷AI社區AICamp聯合舉辦的2018 AI開發者大會在北京盛大召開,來自Google、Amazon、微軟、Facebook、LinkedIn、阿里巴巴、百度、騰訊、美團、京東、小米、字節跳動、滴滴、標貝科技、第四範式等國內外領軍企業的60餘位一線技術大咖將帶來一場技術頭腦風暴。

 

據悉,本次大會也是本年度人工智能領域面向專業開發者的一次高規格技術盛會,議題涉及多個AI領域,包括知識圖譜、機器學習、智慧金融、自然語言處理、語音技術、計算機視覺、數據分析等,對我國人工智能產業的發展和技術應用的深入落地有着極大推動作用。

在語音技術專題演講上,紮根該領域國內明星創企出門問問、雲知聲、標貝科技等公司分別在遠場語音交互、聲紋識別、AIoT 智能交互等不同細分技術領域講述了技術實踐、應用實踐以及現階段遇到的技術瓶頸,並給出了可能的解決方案。

 

“AIoT”即“AI+IoT”,指的是人工智能技術與物聯網在實際應用中的落地融合。當前,已經有越來越多的人將AI與IoT結合到一起來

看,AIoT作爲各大傳統行業智能化升級的最佳通道,已經成爲物聯網發展的必然趨勢。

在基於IoT技術的市場裏,與人發生聯繫的場景(如智能家居、自動駕駛、智慧醫療、智慧辦公)正在變得越來越多。而只要是與人發生聯繫的地方,勢必都會涉及人機交互的需求。而隨着智能終端設備的爆發,用戶對於人與機器間的交互體驗也提出了全新要求——機器聲音更自然,更像真人,使得語音合成(TTS)市場被逐漸激發起來。

 

標貝科技聯合創始人&CTO李秀林看來,語音合成技術作爲一項有着悠久歷史的技術手段,近兩年所運用的技術更新發展得非常快。特別是在今年,端對端技術與神經網絡聲碼器相結合的運用對合成語音的可懂度和自然度有了質的提升,以標貝科技爲代表的智能語音企業得以爲更多企業找到落地場景。

據悉,標貝科技甚至打造了一個“聲音超市”,爲合作伙伴提供了一個可供選擇的,所聽即所得的聲音平臺,助力智能產品向“人性化”發展。

 

根據語音合成的實踐現狀:端到端實際控制難、語音數據少、GPU價格高三大問題,李秀林也提出瞭解決方案。首先,將輸入維度從數萬維降爲數十維,降低控制難度。其次,充分利用文本數據,構建前端模塊,並選擇合適的聲碼器,降低運算量,以此推動語音合成的應用成本降低、應用領域不斷向縱深發展。

同時,李秀林在大會上宣佈:標貝科技首次免費開放語音合成數據庫,數據規模達到10000句,總時長約12小時,以支持非商業用途的學術研究,與行業攜手推進語音事業的發展。

 

此次數據開放的決定得到了大會參與者和同行業的一致高度讚揚。標貝科技認爲,在目前這一階段下,降低數據獲取難度可以推動技術的更新迭代,當更多應用場景湧現、社會效益顯現時,語音合成纔會真正爆發出巨大的能量。

 

 

TTS數據獲取方式

關注標貝科技微信公衆號(biaobeikeji),直接下載數據包

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章