英特爾今天宣布,實驗室與Blockade Labs合作推出Latent Diffusion Model for 3D(LDM3D),這款新穎的擴散模型可使用生成式AI創造3D視覺內容。LDM3D是業界首款使用擴散過程產生深度圖的模型,建立可360度觀看的生動、沉浸式3D影像。
英特爾實驗室AI∕ML研究科學家Vasudev Lal指出,生成式AI技術可以進一步擴大和提升人類的創造力並節省寶貴的時間。
但他說,然而今日絕大多數的生成式AI模型均侷限在產生2D影像,僅有極少數能夠從文字提示中產生3D影像。與目前潛在擴散模型(latent diffusion model)不同的是,LDM3D使用參數數量幾乎相同的模型,從給定的文字提示中產生影像和深度圖。相較於標準深度估測後處理法,可為影像中每個像素提供更準確的相對深度,為開發者節省建構場景所耗費的大量時間。
近年來在電腦視覺領域,特別是生成式AI取得顯著進展。然而今日許多先進的生成式AI模型僅限於產生2D影像,與通常僅能從文字提示中產生2D RGB影像的現有擴散模型不同,LDM3D讓使用者能夠從給定的文字提示中同時產生影像和深度圖。LDM3D在使用與潛在擴散模型幾乎相同的參數數量情況下,相較標準的深度估測後處理法,為每個像素提供更為精確的相對深度。
英特爾指出,這項研究可能徹底改變人們與數位內容的互動方式,使用者能夠以過往想像不到的方式去體驗他們的文字提示。LDM3D所產生的影像和深度圖,讓使用者能夠把靜謐的熱帶海灘、科幻宇宙中的未來世界,透過文字敘述轉換成精細的360度全景圖。
英特爾認為,這種捕捉深度資訊的能力可以立即強化整體的真實感和沉浸感,為娛樂、遊戲、室內設計、房地產銷售,以及虛擬博物館和沉浸式虛擬實境(VR)體驗等各式各樣的行業,開啟創新應用。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:英特爾也玩元宇宙!AI擴散模型生成360度影像
地址:https://www.torrentbusiness.com/article/46771.html