華語樂壇,滿眼都是孫燕姿。
各種音樂平台中,以“AI孫燕姿”爲歌手的歌單和播客正在越來越多,哪怕孫燕姿本人親自回應也無法遏制這樣的風潮。
“我想說的是,你跟一個每幾分鐘就推出一張新專輯的人還有什么好爭的......我還是能分辨出區別的,它沒有情緒,沒有音調和呼吸(或任何你能想到的術語)的變化。很抱歉,我懷疑這只是一個非常短期內的回應。”
歌手們在擔心,人類是否真的無法敵過AI了?而在“被替代”的恐懼背後,更多問題落在了版權層面。第三方是否有權利不經許可就復刻歌手本人的聲音?“孫燕姿們”要如何拿回對自己聲音的控制權?
近日,一款AI歌手音樂創作軟件“網易雲音樂・X Studio”悄然上线。軟件內置12名高度擬人且聲线迥異的AI歌手,其中就包括聲线酷似王菲的AI若溪(代號F970)。網友不禁好奇,若溪與王菲是否有關?AI歌手的訓練數據從何而來?
這個問題問向小冰,軟件的出品方之一。
小冰在國產AI歌姬方面的研究歷史可以追溯到2014年,當時小冰公司還是微軟小冰團隊,他們發布了一款名爲"少女小冰"的聊天機器人。隨着技術的發展,小冰逐漸擴展了其功能,當中包括AI在音樂領域的應用。在2017年,小冰推出了AI歌手的試驗版本,該版本已具備一定的音樂創作和演唱能力。
更清醒的聽衆或許會堅持AI孫燕姿只是人們理解AIGC的又一個俏皮作品,歌迷也並不會真的放棄自己心愛的歌手轉而完全把注意力放在一個沒有生命的替代版本上。人們對AI孫燕姿的討論或許最終會轉化成:AI究竟能在音樂創作中延伸到什么程度?
這場討論其實早已开始了。
“M435”
“虛擬歌手的軟件,其實我們都是有用的,不管是付費的,還是免費的,我們都會去接觸,因爲在日常的創作過程中是經常會用到的。”
孫玉鏡的回答讓人有些意外。作爲幻想動漫音樂的創始人和藝術總監,他帶着團隊負責《羅小黑战記》的全部配樂制作。《羅小黑战記》是國內2D動畫中質量頗高的作品,但因爲制作十分用心,更新的總是緩慢,追更的粉絲甚至开玩笑說要爲這部動畫做好“泡枸杞養生”的准備。
用心和糾結同樣貫徹在動畫配樂上。爲了更理想的創作效果,孫玉鏡的創作過程中已經有了很多AI元素滲入,比如“M435”。
“比如說我們做了一首歌——拿搖滾舉例——我們自己制作人去寫這個旋律,我們自己可能拿自己的嗓子去唱。但是制作人可能在音樂的理論方面,制作方面非常專業,但是唱的話,可能就會效果差一些。但是我們還是需要自己去唱一下,然後再做編曲的工作會順利很多。”
“後來我們直接就用M435”——一個搖滾音色的AI歌手——來唱,然後我們就能快速的確定這個旋律,這個詞到底是不是我們想要的東西。”
“M435”有另外一個名字——AI歌手崔璨。
他當然不是崔健(雖然這個名字讓人浮想聯翩),但顯然,一個“AI歌手”背後的意義,遠不止“咬字和音色准不准確”那么簡單。
“M435”誕生自人工智能小冰框架,被內置於上述AI歌手音樂創作軟件X Studio中。創作者輸入詞曲,3秒內可生成專業歌手水准的AI演唱幹聲。
崔璨和軟件中另外11位AI歌手一起,組成首個虛擬歌手廠牌 WOWAIDO!出道。首張迷你專輯《WOWAIDO!Ⅰ地心引力》6月15日在網易雲音樂上线。不到24小時,其中《致你》這首歌的評論已達到999+,演唱者爲AI何暢(代號F11)和AI徐夢甜(代號F801)。抖音百萬粉絲的AI夏語冰、AI陳水若也在成員名單中出現。
AI歌手在評論區與網友展开“一對一”互動 圖源:小冰
我們一直以聽衆的角度來看待AI歌手的井噴。但其實對於音樂創作者來說,X Studio生產出的不同風格的歌手,填補了音樂創作中的一塊空白,並且這些歌手永遠穩定可靠。
X Studio的AI歌手陣營具備高度擬人及多樣化的聲线風格,可適配流行、民謠、國風、電子、搖滾等各種曲風,也包括埋頭兒童音樂的李召洋苦苦尋找的童音。
畢業於四川音樂學院的李召洋在老師的身份之外也是一位兒童音樂的制作人,但兒童音樂產業發展遠不及成人音樂成熟,他總是感覺一方面家長的需求極高,但適合的童音卻難找——並且哪怕找到了也很難要求一個幾歲的孩子按照要求穩定的唱完一首歌。
他开始在AI歌手中尋找這樣的聲音。少女小冰(代號F002)的聲线是他在同類產品中能找到的最接近童聲的聲音。
這是他喜歡使用X Studio的關鍵原因。他曾使用少女小冰的聲音發表作品《笠翁對韻》,獲得第5屆唱工委音樂獎最佳兒童音樂專輯提名。
孫玉鏡從AI歌手何暢开始了解到X Studio。何暢是X Studio中最成熟的一個AI歌手,曾與馬伯騫、卞子嚴、小柯這些音樂人有過合作,演唱Burberry品牌曲《Runaway2.0》、成都大運會推廣曲《在成都等你》、北京冬奧獻禮曲《唯你無他》等。
“對玩家也好,或者是對從業者,制作人也好,AI歌手如果有成熟作品做得好,他會想,我用這個AI歌手,只要用心調,也能做到這樣,那大家肯定是愿意使用的。”
在孫玉鏡眼中,AI歌手與人類歌手是一樣的,每個人或“人”都有自己的特色。他們優勢互補,能在創作的不同階段幫到自己。“AI歌手24小時在线且狀態恆一,在創作初期的詞曲、編曲階段,能幫創作者隨時調整完善,看到至少80%成品的樣子。在創作末期的錄音階段,由於人與人的交流更直接,人類歌手能按我的示範快速調整對某處細節的演繹。”
X Studio也確實給了使用者極大的創作自由度。
它內置了小冰歌唱模型、一致性超級自然語音、流式渲染歌聲合成和視覺神經網絡渲染等技術。創作者能通過調整參數,實現AI歌手的滑音、轉音、顫音、咬字、節奏、音色、強弱等變化,細膩演繹作品效果。這意味着在標准音色和演唱風格的基礎上,使用者可以將其打磨成更具有個人風格或者更符合自己設想的AI歌手。
除此之外,X Studio另一個強大的能力在於支持合並AI音軌的數量高達30軌,也就是說每個音樂人都可以擁有一支“30人”的合唱團。
音樂制作人宋承容的朋友圈
消除版權疑雲
最使音樂創作者頭痛的無異於版權問題,而在X Studio中的AI歌手均無版權風險。
有網友將自己的AI音樂作品放在網絡上,使用的聲音原型是小冰的AI歌手若溪,在做了更細節的調音後,AI歌手的聲线像極了王菲,它唱了一首《紅豆》。
AI孫燕姿之後,或許會有更多歌手被AI化。理論上只要你有一個你想要訓練成的音色的音頻數據集——比如兩個小時王菲的唱片或採訪音源——然後根據這個音頻數據集來訓練模型,接着用這么訓練完的模型去推理和替換另一首歌中聲线——比如刀郎的《情人》,你最終就可以聽到王菲版本的《情人》。
這是一個更麻煩的流程,且伴隨着巨大的版權風險。
北京大成律師事務所高級合夥人肖颯在一次採訪中表示,一個翻唱行爲要合法化,需要取得權利人的許可。肖颯指出,一首歌曲的產生,往往涉及諸多權利人,其著作權體系較爲復雜。具體而言,可能包含該歌曲詞曲作者的著作權、該歌曲演唱者作爲表演者的權利以及相關公司作爲錄音錄像制作者的權利。、
“理想情況下需要取得前述所有權利人的許可,否則其翻唱行爲極有可能侵犯前述主體的相應權利,從而需要承擔侵權責任。即便是AI翻唱,也受到此種規則的限制。”
創作者訓練了一位知名歌手的聲音來唱一首新歌,這首歌火了,是這個創作者的功勞,還是AI或者那位知名歌手的?創作者要面對的是音樂工業中復雜的權利人體系,知名歌手本人要面對的是無法掌控自己聲音的使用場景以及潛在的取得收益的機會。這是不斷出現的知名歌手AI化背後的普遍問題。
這個問題的解決亟需音樂平台作爲中間一環進場。後者本身已經包含了音樂工業從創作者到歌手的完整流程。這也是此次X Studio的更新重點。
這或許是“AI孫燕姿們”合法化的第一步。小冰公司透露,已有真人歌手主動授權公司“克隆”自己的聲音,來保留巔峰狀態。歌手能決定AI聲音的用途並取得相關收益。經過本人訓練調優,AI聲音將有機會獲得更好的表現。當市場出現越來越多“正版”聲音,良幣驅逐劣幣,或許能解決“孫燕姿們”的問題,也能給予音樂創作者更多選擇。
官方同時表示,小冰始終倡導AI技術的安全發展之路。軟件包含高安全性和隱私保護策略,所有AI歌手均經過嚴格的數據訓練,所有創作均可溯源,希望此舉能爲AI創作的未來提供良性發展參考。
尾聲
或許我們可以從音樂合成器的歷史中找到一些對AI歌手的信心。
合成器是一種電聲樂器,原理是以產生的電信號通過放大器推動揚聲器產生聲音。這讓它可以模擬那些真實存在的樂器音色,比如鋼琴、鼓甚至弦樂。另一方面,合成器也可以在調試過後去形成現實中的環境採樣聲音,或甚至在現實中根本無法找到的聲音。
合成器在上個世紀60年代從流行音樂切入开始受人關注。80年代Yamaha推出的數字合成器DX7以及90年代隨着計算機普及進一步興起的軟件合成器則一步步鞏固了合成器在音樂制作中的角色,甚至圍繞合成器形成了Synthwave這樣的音樂流派。
將AI歌手放在真實歌手的對立面上,不如將AI歌手看作一種繼續發展的合成器。
音樂制作過程中,合成器的能力已經從最初對於真實樂器的還原進化到對於各種環境聲音,比如漲潮和蟲鳴的還原,相比之下,變幻莫測的人聲是合成器的終極命題。兩者都在經歷一個從被質疑到被普遍接受的過程。
而合法化後的“AI孫燕姿”們,最終會對未來的音樂創作帶來幫助。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:AI歌手 不甘心只做“AI孫燕姿”
地址:https://www.torrentbusiness.com/article/46116.html
標籤:人工智能