AI技術突破音頻內容生產瓶頸,文字時代加速轉向聲音時代

2018年2月,中讀的會員卡分銷一夜之間在朋友圈刷屏,一日之內售賣5.4萬份,也讓這個《三聯生活週刊》(以下簡稱《三聯》)推出的知識平臺第一次爲大衆所熟知。

然而,當知識分銷後來被微信緊急叫停,一次性打包售賣10年雜誌電子版的“大甩賣”,註定要回歸到細水長流的知識付費。

傳統媒體轉型的最大痛點:文字內容“產品化”

雖然中讀也曾經找過朗郎這樣的明星IP來合作頭部內容,但並不順利。因爲與得到、喜馬拉雅這樣的頭部內容平臺相比,20多年下來積累的優質內容及讀者羣體,纔是中讀相比其他平臺最大的優勢。

然而,把這些文字內容專爲化知識付費產品,卻註定要經歷一個“內容產品化”的過程。10年電子版會員卡這種簡單粗暴的方式,也要讓位於更精細、更原生、更智能的產品設計。

“我們的文字內容是常態化生產的,但是音頻內容沒有達到這個目標,不管是小課還是專欄,都不能做大常態化生產。”中讀創始人朱文軼曾經表示,讓音頻內容可以有規律性地持續生產是中讀團隊一直以來的追求,也是整個知識付費行業的“痛點”。

2018年,中信出版集團找到《三聯》,將《我們爲什麼愛宋朝》、《宋朝那些人》兩個“爆款”封面故事集結出版,這也是雜誌將內容再次變現的傳統方式。

然而,隨着互聯網碎片化內容獲取變得愈發廉價與便捷,紙質書銷量的連年下滑,對於雜誌來說,“集結出版”這塊原本脂肥膏厚的蛋糕優勢不再。

“我們還可以做什麼?”當中信出版的圖書引發了一定反響後,《三聯》總經理李鴻谷陷入了新的思考。

對於文字時代的“視覺超載”,他進行了深入的思考:

古登堡發明印刷機的時間是1439年,有個統計是,此後的1453到1503年,歐洲的印刷文本共800萬冊,等於之前歐洲全部手抄本的文字量。 而如今,隨着信息進入互聯網深度傳播時代,全球每年創造的信息量更是不計其數。《三聯》的執行主編每日至少要通過pad或手機、電腦讀5萬字的文本,這些容易產生視覺疲勞和“視覺超載”。

AI音頻技術,突破了聲音內容的生產瓶頸

鑑於此,《三聯》開始考慮擴大此前於2017年開始試水的音頻課程,將宋朝故事發展成了音頻內容《我們爲什麼愛宋朝——宋朝美學十講》。繼按專欄集結成書之後,存量內容又有了更易消費和傳播的呈現方式。

只是接下來,在大規模“文字音頻化”的過程中,原作者的時間成本與專業聲優的製作成本,成爲了其盤活億級內容資源的瓶頸。

在中讀開設音頻節目的《三聯》資深主筆袁越,談到了自己錄製時的使用感受:

我花15年寫了80多萬字的《生命八卦》專欄文章。如果在錄音棚裏把它們一遍又一遍朗讀出來,會累死。如果用普通音頻軟件來讀,又很容易讀成催眠曲。

隨着AI語音技術的持續發展,中讀終於找到了音頻內容常態化生產的“最優解”。

8月21日至8月25日,北京國際圖書博覽會(BIBF)期間,中讀舉辦了以“聲音裏的知識和AI”爲主題的知識大會。在大會上,中讀介紹了自己謀求轉型的新經驗,在2017年年入局付費音頻領域後,又發佈了首個AI語音定製專欄。

爲此,《三聯》採用的新方式,是攜手微軟,將個性化語音定製技術運用到有聲內容生產中,AI音頻在經過訓練後被賦予文章原作者的聲音,讓聽衆感覺到“如聞其聲”。

傳統的有聲內容主要依靠名人、主講人或者聲優親自上陣錄製,往往需要耗時幾個月,成本巨大。聲音錄製也受限於人員、時間、環境等因素,無法實現產能最大化,求知者接收優質內容的時間也會隨之延遲。

而個性化語音定製系統則徹底突破了生產瓶頸,只需少量訓練數據量就可以訓練出一個逼真自然的人工智能聲音,大幅度提高了存量內容的轉化效率,有利於優質內容的高效生產、再生產以及聲音知識的優化和傳播。

文字內容的音頻化也不僅是一個文字轉換爲聲音的過程,更是與用戶關係的進一步拉近,畢竟性格各異的聲音比千字一面的文字更有親切感,更容易打造作者的獨特人設。

不僅如此,相比於文字內容結集出版,音頻課程的規模化生產可以更自由、靈活地對文字內容進行結構化梳理,無論是大課、小課都可以靈活定製。除了億級的存量內容,《三聯》每期15—20萬字的內容將成爲源源不斷的內容庫。文字內容與音頻課程的同步、互動,也將激發出更大的想象空間,可以稱得上是內容領域的O2O。

破壁語種障礙,多語言音頻內容助力文化出海

AI技術也使“生產出形式多樣的衍生內容產品”成爲可能。“讓課程主講人開口說他不會說的語言,從英語、法語甚至是當地方言,實現多語種及多種說話風格的輸出”是中讀進行的另一項大膽嘗試。

本次大會上,中讀除了展示首個AI音頻產品《土摩托·生命八卦》外,還展示了最新推出的《宋朝美學十講》的英文版本。

當《三聯》與中讀的高知用戶走向海外,常常會遇到向外國人傳遞中國傳統文化的反向需求。此時,AI技術便可生成有一定語調和節奏感的他國語言版中國故事,便於擁有對外漢語傳播交流需求的人羣向外輸出。

不僅如此,這種中英文內容的切換,對在國內生活的海外留學生和專家學者來說,也拓展了學習漢語和漢文化的途徑和內容。

在“中讀”《土摩托·生命八卦》知識音頻欄目下,鈦媒體發現,有受衆指出了音頻仍像“機讀”、斷句和讀音錯誤等技術bug。誠然,當AI音頻初推之際,技術的不足會影響用戶體驗;不過,技術會隨着發展而進步,AI音頻普及之後可能帶來的知識產業變革,卻是不容忽視的行業新風向。

在AI語音技術的加持之下,能夠轉換語種的合成音頻產品,對於《三聯》來說,不但盤活了存量內容資源、拓展了用戶的碎片化使用場景,還破壁了語言限制、將用戶肖像擴大到了截然不同的新羣體中。

同時,AI音頻的普及,還使原本生產一次性內容的文字工作者變成了IP供應商,極速提升了產品二次變現的效率,可以很大程度地改善傳統寫作者的生存狀態。

圖片來源@視覺中國

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章