Meta AI MMS模型可辨識全球超過4000種語言

2023/05/23 13:22

文 |

世界上許多語言正面臨消失危機，Meta今日宣布，旗下大規模多語言語音模型（MSS）能擴展文字轉語音及語音轉文字技術應用範圍，從最初的100種語言，至今已可轉換超過1100種語言，是過去的10倍，此外，還能夠辨識超過4000種口語語言，是過去的40倍。

Meta指出，這項技術已有許多應用案例，從 VR（虛擬實境）、AR（擴增實境）至訊息服務，不僅能夠使用偏好的語言操作，更可理解每個人的聲音。Meta將開放這項技術的原始碼及模型，讓研究社群能以現有工作成果為基礎繼續開發，一同保存全球的言，拉近人們的距離。

過去，大型語音資料庫最多僅能涵蓋100種語言，因此，Meta開發此技術所面臨的第一個挑戰，即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰，Meta使用已翻譯成多種語言、譯文的「聖經」，作為語言文字訓練資料。

聖經譯文有多種語言的公開錄音檔，作為大型多語言語音模型計畫的一部分，Meta創造的資料集，蒐集超過1100種語言的「新約聖經」有聲讀物資料集，平均為每種語言提供32小時的語音訓練資料，後續又加入其他未標註的基督教有聲讀物後，可用的語言訓練資料已涵蓋超過4000種語言。

Meta指出，雖然資料集收錄聲音以男性居多，但測試成果顯示，不論是男性或女性的聲音，此語音模型皆能同等準確地辨識。此外，上述的語言訓練資料大多為宗教相關的內容，但分析顯示，這並不會使模型傾向生成出更多的宗教性質語言。

Meta表示，將持續擴增大規模多語言語音模型涵蓋範圍，以支援更多語言的轉換及辨識，並努力克服現有語音技術難以處理方言的挑戰。

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標題：Meta AI MMS模型可辨識全球超過4000種語言

地址：https://www.torrentbusiness.com/article/38933.html

Meta AI MMS模型 可辨識全球超過4000種語言