標貝科技 | 愛說唱、初音未來、小冰...今天我們來說說那些AI歌手們

當下,說唱文化正逐漸在中國流行起來。
自去年夏天一檔說唱類節目橫空出世以來,社交網站上的話題幾乎都被它包圓了,以至於今年要播出的第二季還未見蹤影,就已經引爆了觀衆的期待感。
這類節目把說唱歌曲這類小衆文化帶到更廣泛的人羣面前。但對於普通用戶來說,比起流行歌曲,“說唱”顯然更有難度:節奏、押韻,說唱文化中的嘻哈態度都讓人望而卻步。
但是最近,人工智能好像爲我們解決了一部分難關。
在百度7月4日舉辦的AI開發者大會上,百度副總裁沈抖攜說唱歌手孫八一,發佈了一款名爲“愛說唱”的智能小程序:用戶只需選擇背景音樂,然後隨便說出一段話,就可自動生成一段堪比專業的RAP歌曲。
人人皆可RAP?聽上去很吸引人。作爲人工智能的新嘗試,愛說唱獲得了不少目光,畢竟沒有freestyle也沒問題了。那麼,還有哪些人工智能已經在樂壇上出道了?
今天小貝就帶大家來盤點一下那些AI歌姬們。
初音未來、洛天依
說起“虛擬偶像”,幾乎所有的宅友們腦海中跳出的第一個名字便是“初音未來”,作爲世界上第一個舉辦演唱會的虛擬歌手,世界第一公主殿下的名號可以說是響徹雲霄。
初音未來,是2007年由Yamaha的VOCALOID系列語音合成程序爲基礎開發的虛擬少女偶像。
對,你沒有看錯,這個蔥色雙馬尾辮的少女的締造者,是雅馬哈。說到雅馬哈,估計大家腦子裏首先跳出來的會是:
事實上,看起來“不務正業”的雅馬哈產品還包括鋼琴、電子琴、數碼鋼琴、等樂器,
音效芯片、XG聲卡、影音處理機器、系統處理機器、專業音響機器、半導體至電子產品、防音工程及高爾夫球用品都屬於業務範圍之內。
總之,就是讓你彈雅馬哈、聽雅馬哈、用雅馬哈、玩雅馬哈、打雅馬哈....
我整個人都雅馬哈了
2004年,雅馬哈開發了電子音樂製作語音合成軟件核心引擎VOCALOID,就是初音未來和她的中國風妹妹洛天依的核心。
根據目前主流的語音合成方式,Vocaloid採用的是“拼接合成”技術,使用者可以通過輸入歌詞和音符的方式直接生成歌曲。
如果需要創作一首新的曲子,使用者需要規劃歌詞和音調,編輯歌詞和音調。並且可以對生成的"唱詞"進行各項微調,包括呼吸力度、口的開合甚至顫音,令原本破碎的聲音數據變爲連貫的類人電子聲音。
採用這種方式來創作,可以實現對歌曲最精確的控制,最大限度展現創作者的音樂想法。但另一方面,也很需要作者調整各項參數的功力。
微軟小冰
不同於初音未來這種天生歌姬,微軟小冰是半路出家,唱歌的原理也不一樣。
虛擬歌手需要錄製好的聲音庫,再通過重新拼接聲音庫中的片段形成歌曲;而小冰唱歌是根據輸入的信號做出發聲的反應,也就是機器學習。
第四代的小冰在音調、音質、自然度、銜接上都有了極大的改進,此外又加上了換氣的聲音和人類的演唱技巧,大大提高了演唱的自然度。
佐藤莎莎拉
佐藤莎莎拉是由基於HMM合成技術的聲音創作軟件CeVIO Creative Studio創造的虛擬歌姬,因其酷似真人的聲音,被粉絲稱爲站立在現實和動畫的交界處的女主角。
CeVIO Creative Studio採用的算法在本質上與VOCALOID的"拼接算法"不同,HMM合成通過提取人聲中的特徵量建模,可以最大程度保留人聲的特徵,經過後期可以與VOCALOID媲美甚至更加接近人聲,在聲音的擬真度上可以說也並不遜於今天的小冰。
在某種意義上,虛擬歌姬和小冰都是利用技術降低了藝術創作的門檻,但根本性的不同在於對這一問題的回答:
科技在藝術創作中應該扮演什麼樣的角色?
顯而易見的是,小冰所代表的無疑是一個激進的科技派:利用科技的發展降低、乃至消除藝術創作的門檻,讓技術引導人類的進步。
而Vocaloid方面,儘管YAMAHA公司也一直在不斷探索前沿的語音合成技術,在音樂創作上採取的卻是最爲傳統的姿態:提供一個樂器,但將創作的自由完全歸還給創作者。
這種態度最大程度上回歸了藝術的本源:人的自我表達,但另一方面,也在客觀上保留了創作的門檻。在Vocaloid的圈子裏,真正創造價值的仍然是創作者本身,在這裏,技術讓位於了人類。
當然,以小冰的人工智能水平,我們並不需要討論“人工智能威脅論”之類的東西,但現實的問題確實擺在眼前:
在藝術創作領域,“大衆”、“簡便”的工業化生產似乎已經近在咫尺,而這種流水線生產真的就能完全取代專業而精密的調教了嗎?對於創作者而言,“藝術創作”究竟是怎樣一種行爲,而對於觀衆們來說,他們欣賞藝術作品時,希望接收到的又是什麼呢?
小貝認爲,藝術創作所賦予觀衆乃至社會的,並不是簡單地文字優美、曲調生動,而應該是一種來自於現實社會的思想。
標貝科技 • 音領智能未來
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章