英特爾實驗室與Blockade Labs今(27)日共同宣布,雙方合作推出Latent Diffusion Model for 3D(LDM3D),是一款新穎的擴散模型,使用生成式AI創造栩栩如生的3D視覺內容。
英特爾表示,LDM3D是業界首款使用擴散過程產生深度圖的模型,建立可360度觀看的生動、沉浸式3D影像。從娛樂、遊戲再到建築、設計等方面,LDM3D具備為內容創作、元宇宙應用和數位體驗帶來革命性變化的潛力。
英特爾實驗室AI∕ML研究科學家Vasudev Lal,表示,生成式AI技術可以進一步擴大和提升人類的創造力並節省寶貴的時間。但今日絕大多數的生成式AI模型均侷限在產生2D影像,僅極少數能夠從文字提示中產生3D影像。與目前潛在擴散模型(latent diffusion model)不同的是,LDM3D使用參數數量幾乎相同的模型,從給定的文字提示中產生影像和深度圖。相較於標準深度估測後處理法,可為影像中每個像素提供更準確的相對深度,為開發者節省建構場景所耗費的大量時間。
英特爾強調這項成果,未來將透過開放式生態系讓人們更廣泛地運用AI優勢。LDM3D讓使用者能夠從給定的文字提示中同時產生影像和深度圖。並可能徹底改變人們與數位內容的互動方式,使用者能夠以過往想像不到的方式去體驗他們的文字提示。LDM3D所產生的影像和深度圖,讓使用者能夠把靜謐的熱帶海灘、科幻宇宙中的未來世界,透過文字敘述轉換成精細的360度全景圖。這種捕捉深度資訊的能力可以立即強化整體的真實感和沉浸感,為娛樂、遊戲、室內設計、房地產銷售,以及虛擬博物館和沉浸式虛擬實境(VR)體驗等各式各樣的行業開啟創新應用。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:英特爾實驗室推出AI擴散模型 從文字提示產生360度影像
地址:https://www.torrentbusiness.com/article/46881.html