Nvidia展示可修改並生成聲音的AI模型Fugatto

2024/11/26 10:33

文 |

輝達（NVIDIA）周一展示一款用於生成音樂和聲音的新型人工智慧（AI）模型，此模型以音樂、電影和影像遊戲製作者為訴求對象，可以藉此修改聲音並生成新的聲音。

輝達表示，目前還沒有公開發表這項技術的計畫。這項技術稱為 Fugatto，是Foundational Generative Audio Transformer Opus 1的縮寫。這技術與Runway等新創公司和Meta Platforms 等大公司展示的技術一樣，可以根據文字提示來生成聲音或影片。

Nvidia的技術可以根據文字描述生成音效和音樂，包括新奇的聲音，例如讓小號發出狗叫聲。

和其他AI技術的不同之處在於，它能夠接收和修改現有的聲音，例如將鋼琴彈奏的一段旋律轉換成人聲唱出的旋律，或者改變語語錄音的口音和情緒。

輝達應用深度學習研究副總裁 Bryan Catanzaro說：「若回顧過去50年的合成音頻，會發現現在的音樂聽起來已經不同了，因為有了電腦和合成器，我認為生成式AI將為音樂、影像遊戲和想要創造事物的普通人帶來新的功能。」

輝達的新模型是基於開放資料訓練而成，該公司表示仍在討論是否且以什麼方式公開發表這項技術。

【美選熱話題】

▪不斷更新／司法部長醜聞纏身換將爭議滿點的川普新內閣名單
▪2024美選開票完整數據／6州變天翻轉關鍵搖擺州全被川普拿下
▪川普勝選關鍵「7大搖擺州」左右選情近3次開票結果比較

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：Nvidia展示可修改並生成聲音的AI模型Fugatto

地址：https://www.torrentbusiness.com/article/136362.html

標籤：AI NVIDIA 人聲輝達音樂