網易易盾音頻過濾服務再次迭代 新增音頻實時檢測

隨着用戶獲取信息的方式差異化,音頻產品因爲使用場景多元、伴隨性和碎片化,在當下快節奏的社會中,受到越來越多的用戶歡迎。iiMedia Research數據顯示,2018年在線音頻用戶規模增速達22.1%,2018年用戶數量達到4.25億。

用戶的快速發展,也伴隨着低俗、×××內容在這些音頻平臺上蔓延。最典型的就是去年6月份,全國“掃黃打非”辦公室約談多家網站負責人,要求各平臺大力清理涉×××低俗問題的ASMR內容,加強對相關內容的監管和審覈。

然而對音頻的內容審覈存在多個難點,比如說語音識別和聲紋識別難、數據標註成本大等,給很多音視頻平臺的發展帶來困擾。爲此,網易易盾在2018年推出了音頻檢測服務,通過業內領先的語音識別技術,精確、高效地幫助音頻平臺分析和識別出各類違規音頻。

最近,網易易盾又對音頻檢測服務進行迭代升級,在點播音頻過檢的基礎上,開始支持直播音頻,實現實時音頻檢測。

網易易盾音頻過濾服務再次迭代 新增音頻實時檢測

網易易盾能實時過濾直播間音頻,確保直播間內容安全

易盾的實時音頻檢測,依託網易雲計算資源,動態擴容,彈性伸縮,輕鬆滿足客戶單日億級請求,特有的降噪處理和多維度檢測,能夠從源頭保障音頻平臺的內容安全。

網易易盾音頻過濾服務再次迭代 新增音頻實時檢測
網易易盾音視頻檢測架構

除了支持實時檢測外,本次直播音頻檢測還新增了結合場景的關聯分析:能夠根據彈幕、主播等信息維度,通過文本NLP模型、規則引擎、智能特徵庫等技術實現提前風險預判,更準確地返回審覈結果。

高準確性的背後是網易易盾在聲紋檢測的背景環境和數據多樣性上下足了功夫。據網易易盾算法專家姚澤平介紹,音頻實時檢測上最大的難題是背景噪聲的動態變化,導致違規音頻和背景噪聲的重疊更加複雜,讓模型分類難度變大。

“我們做了兩方面工作,一方面是人工地構造一些特定場景的背景噪聲,和違禁數據相混合,用這些數據訓練模型,提高模型對動態背景環境的魯棒性。另一方面是,通過對數據進行歸一化的方法,減少客觀因素對模型分類造成的影響。”姚澤平說到。

領先技術的應用,使得網易易盾音頻檢測能夠高效識別×××語音、渉政、嬌喘語音、ASMR、謾罵等違規語音;在應用場景上,也能完美覆蓋IM通訊、點播音頻和直播音頻。

目前,網易易盾已和多家音視頻內容平臺展開了合作,包括觸電新聞和網易雲音樂。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章