標貝科技 | 愛說唱、初音未來、小冰...今天我們來說說那些AI歌手們

當下，說唱文化正逐漸在中國流行起來。

自去年夏天一檔說唱類節目橫空出世以來，社交網站上的話題幾乎都被它包圓了，以至於今年要播出的第二季還未見蹤影，就已經引爆了觀衆的期待感。

這類節目把說唱歌曲這類小衆文化帶到更廣泛的人羣面前。但對於普通用戶來說，比起流行歌曲，“說唱”顯然更有難度：節奏、押韻，說唱文化中的嘻哈態度都讓人望而卻步。

但是最近，人工智能好像爲我們解決了一部分難關。

在百度7月4日舉辦的AI開發者大會上，百度副總裁沈抖攜說唱歌手孫八一，發佈了一款名爲“愛說唱”的智能小程序：用戶只需選擇背景音樂，然後隨便說出一段話，就可自動生成一段堪比專業的RAP歌曲。

人人皆可RAP？聽上去很吸引人。作爲人工智能的新嘗試，愛說唱獲得了不少目光，畢竟沒有freestyle也沒問題了。那麼，還有哪些人工智能已經在樂壇上出道了？

今天小貝就帶大家來盤點一下那些AI歌姬們。

初音未來、洛天依

說起“虛擬偶像”，幾乎所有的宅友們腦海中跳出的第一個名字便是“初音未來”，作爲世界上第一個舉辦演唱會的虛擬歌手，世界第一公主殿下的名號可以說是響徹雲霄。

初音未來，是2007年由Yamaha的VOCALOID系列語音合成程序爲基礎開發的虛擬少女偶像。

對，你沒有看錯，這個蔥色雙馬尾辮的少女的締造者，是雅馬哈。說到雅馬哈，估計大家腦子裏首先跳出來的會是：

事實上，看起來“不務正業”的雅馬哈產品還包括鋼琴、電子琴、數碼鋼琴、等樂器，

音效芯片、XG聲卡、影音處理機器、系統處理機器、專業音響機器、半導體至電子產品、防音工程及高爾夫球用品都屬於業務範圍之內。

總之，就是讓你彈雅馬哈、聽雅馬哈、用雅馬哈、玩雅馬哈、打雅馬哈....

我整個人都雅馬哈了

2004年，雅馬哈開發了電子音樂製作語音合成軟件核心引擎VOCALOID，就是初音未來和她的中國風妹妹洛天依的核心。

根據目前主流的語音合成方式，Vocaloid採用的是“拼接合成”技術，使用者可以通過輸入歌詞和音符的方式直接生成歌曲。

如果需要創作一首新的曲子，使用者需要規劃歌詞和音調，編輯歌詞和音調。並且可以對生成的"唱詞"進行各項微調，包括呼吸力度、口的開合甚至顫音，令原本破碎的聲音數據變爲連貫的類人電子聲音。

採用這種方式來創作，可以實現對歌曲最精確的控制，最大限度展現創作者的音樂想法。但另一方面，也很需要作者調整各項參數的功力。

微軟小冰

不同於初音未來這種天生歌姬，微軟小冰是半路出家，唱歌的原理也不一樣。

虛擬歌手需要錄製好的聲音庫，再通過重新拼接聲音庫中的片段形成歌曲；而小冰唱歌是根據輸入的信號做出發聲的反應，也就是機器學習。

第四代的小冰在音調、音質、自然度、銜接上都有了極大的改進，此外又加上了換氣的聲音和人類的演唱技巧，大大提高了演唱的自然度。

佐藤莎莎拉

佐藤莎莎拉是由基於HMM合成技術的聲音創作軟件CeVIO Creative Studio創造的虛擬歌姬，因其酷似真人的聲音，被粉絲稱爲站立在現實和動畫的交界處的女主角。

CeVIO Creative Studio採用的算法在本質上與VOCALOID的"拼接算法"不同，HMM合成通過提取人聲中的特徵量建模，可以最大程度保留人聲的特徵，經過後期可以與VOCALOID媲美甚至更加接近人聲，在聲音的擬真度上可以說也並不遜於今天的小冰。

在某種意義上，虛擬歌姬和小冰都是利用技術降低了藝術創作的門檻，但根本性的不同在於對這一問題的回答：

科技在藝術創作中應該扮演什麼樣的角色？

顯而易見的是，小冰所代表的無疑是一個激進的科技派：利用科技的發展降低、乃至消除藝術創作的門檻，讓技術引導人類的進步。

而Vocaloid方面，儘管YAMAHA公司也一直在不斷探索前沿的語音合成技術，在音樂創作上採取的卻是最爲傳統的姿態：提供一個樂器，但將創作的自由完全歸還給創作者。

這種態度最大程度上回歸了藝術的本源：人的自我表達，但另一方面，也在客觀上保留了創作的門檻。在Vocaloid的圈子裏，真正創造價值的仍然是創作者本身，在這裏，技術讓位於了人類。

當然，以小冰的人工智能水平，我們並不需要討論“人工智能威脅論”之類的東西，但現實的問題確實擺在眼前：

在藝術創作領域，“大衆”、“簡便”的工業化生產似乎已經近在咫尺，而這種流水線生產真的就能完全取代專業而精密的調教了嗎？對於創作者而言，“藝術創作”究竟是怎樣一種行爲，而對於觀衆們來說，他們欣賞藝術作品時，希望接收到的又是什麼呢？

小貝認爲，藝術創作所賦予觀衆乃至社會的，並不是簡單地文字優美、曲調生動，而應該是一種來自於現實社會的思想。

標貝科技 • 音領智能未來