本期是【元宇宙三千問】的第四期,我們非常有幸邀請到了ZEGO即構科技行業運營專家、元宇宙商業化負責人Lily,Lily老師致力於通過場景化的行業解決方案,助力客戶獲得業務成功。ZEGO即構科技憑借多年的技術積累,探索出了較爲完善的解決方案,幫助企業更加便捷地接入元宇宙,共建元宇宙UGC生態體系,以下Enjoy。
元宇宙之心:元宇宙是一個龐大的开放世界,是一個能讓所有用戶共同參與的多元生態,當前,以UGC(用戶創造內容)爲主要內容創作模式的元宇宙生態體系正在形成。
元宇宙之心有幸邀請到了ZEGO即構科技行業運營專家、元宇宙商業化負責人Lily老師,和我們一起聊聊當前距離元宇宙UGC生態成形還差幾步?ZEGO即構科技又提出了怎樣的解決方案,歡迎Lily老師的到來。
Q1.2021年,元宇宙在海內外掀起了一場科技熱潮,如今元宇宙概念回歸理性,虛擬與現實融合的新場景正在逐步落地,作爲全球領先的實時音視頻雲服務商,ZEGO即構科技是如何看待元宇宙的?
Lily:其實即構最早是提供多人連麥的服務商。從2015年开始,我們就通過連麥音視頻通話直播的能力進入了實時互動的賽道。與此同時,我們也一直在思考怎樣結合更先進的技術以及各種業務場景,打造出更新潮的玩法,爲线上互動帶來更多的便利和趣味。
2019年,我們觀察到人工智能技術工程化逐步成熟,並且能在更多場景中落地开花,此外,語音視頻的前後處理算法和能力也得到了廣泛且有深度的發展。這些技術融合互聯網雲通訊,能帶來更加精彩的线上互動,也能滿足用戶需求在信息准確之外的精神追求。
關於互聯網產品多元化內容和玩法的趨勢,我們團隊投入了大量的資源和人力,專門去研究AI音效處理、視覺處理以及大規模线上人機交互和數據同步等多種算法和技術,尋找线上互動能力的突破。
元宇宙場景是具有空間感、沉浸感的新體驗,人和人的互動方式也有了全新的想象空間。這種想象空間和线上交互的趣味性以及立體化,爲生活工作帶來了便利,符合即構所堅持的愿景:實時互動讓工作和生活更加輕松有趣。
Q2.衆所周知,今年8月ZEGO即構科技發布了元宇宙智能互動引擎,給元宇宙產業的开發者和同行者帶來了更多相關玩法,提供了非常具有價值的高效工具,Lily老師能爲我們介紹下元宇宙智能互動引擎是什么嗎?
Lily:那我簡單介紹一下,即構的元宇宙智能互動引擎是由解決方案層以及Metaworld SDK、編輯器以及內容供給這四大部分組成。
對於客戶來說,可以按照需求單獨或者組合接入,引擎的主要目的是搭建低門檻的通道幫助企業快速打造元宇宙場景。
四大組成部分中最核心的是Metaworld SDK,它提供了开放世界所需的業務組件和基座能力,开發者可以按需選擇使用,這其中還包括了虛擬人Avatar,通過面部隨動等能力,可以讓用戶即使身着數字面具,也能通過表情隨動傳遞自己的真情實感。
除此之外,即構還有針對業務場景、圍繞不同行業提出不同的解決方案。現在已經持續有客戶在洽談接入。而編輯器的主要能力是幫助沒有引擎使用相關經驗的客戶也能夠輕松實現對素材的編輯、人景交互的構建等需求。同時ZEGO還會提供完善的內容供給服務,幫助用戶解決素材生產、更新的問題。
Q3.咱們元宇宙智能互動引擎主要服務於哪些群體?有沒有客戶案例可以分享呢?
Lily:先簡單講一下元宇宙智能互動引擎主要服務的對象,它分爲以下幾類。
第一類是社交泛娛樂賽道中的企業,這是即構目前對接的大部分客戶,對於這類客戶來說,他們所處的賽道和元宇宙的屬性非常契合,能夠從元宇宙的內容中獲得增長的動力,同時也具備落地元宇宙玩法的技術基礎,大部分社交平台自身可能在3D开發以及驅動算法上的積累並不充足,引擎正好能夠幫助客戶實現低門檻搭建場景,快速擁有靈活自然的虛擬人驅動等能力。
同時即構提供的解決方案也可以與這些企業的業務場景很好地結合。比如說映客、么么直播旗下的社交產品等都是即構的客戶。我們現在正在對接的頭部客戶可能近期就會上线,大家可以保持關注。
除此之外,政企工業產業領域也是即構的目標客戶。沉浸式的互動可以讓場地信息更加真實,用戶體驗產品也將更加生動有趣。針對這些場景,即構也結合了業務場景的解決方案和產品能力。比如黨建相關的展覽館、博物館美術館,即構可以支持客戶構建超大場景,並且通過技術展示裏面的產品。
再比如汽車行業的线下車展,我們可以把它搬到线上,這樣就可以容納更多的人,打破時間空間的限制,线上空間也能給汽車行業提供更多觸達顧客的機會。除此之外還有數字營銷,活動舉辦發布會等豐富的場景。
Q4.元宇宙的舞台離不开Avatar,甚至催生了新的職業“捏臉師”,即構是如何構建和發布虛擬人的呢?
Lily:即構虛擬人驅動確實也是我們的優勢,ZEGO Avatar所構建的虛擬人在場景內實現跑、跳、走這些動作其實用到了Metaworld SDK。我們爲場景中虛擬人提供了比較豐富的肢體動作,比如說跳舞,這些都是預制動作的方案,也更適用於娛樂場景。
針對客服播報、直播等場景,更多用到的是面部表情隨動以及肢體隨動的這些能力,這些即構也都是支持的。大家可能比較關注虛擬形象的模樣以及背後的生成原理,即構通過用戶手動捏臉或者拍照生成形象。同時還支持比較多樣的模型風格,比如Q版、二次元等等。
Q5.盡管不少用戶對元宇宙仍感到困惑,但年輕的Z世代對於元宇宙的接受度卻很高,同時更加豐富的互動能力會更加吸引年輕人,那么請問Lily老師,企業與平台應該怎樣抓住年輕群體的胃口?
Lily:目前年輕用戶對元宇宙的接受程度會更高一些,但同時他們的需求也會更高,我個人認爲針對年輕人群體的社交需求可能有幾個關鍵的要素,比如沉浸式的互動、個性化的內容、以及多元化的創作者。
首先,傳統用戶交流是通過文字、圖片等方式來進行互動的,但現在用戶對實時性的要求更高,比如他們希望能夠通過語言動作進行面對面的實時交互,甚至說需要臨場感、沉浸感。
元宇宙的3D空間,同時配備了範圍語音,用戶可以聽到聲音是從哪個方向傳來的,他們可以控制虛擬人在裏面行動,有第一人稱、第三人稱不同的視角,這些功能可以幫助客戶打造具有高度沉浸感,臨場感的社交場景,通過這種方式帶給年輕用戶沉浸式的社交體驗。
其次就是個性化的內容,個性化是社交裏的重要標籤,能夠體現出用戶的喜好並幫助他們找到志趣相同的人。用戶在元宇宙中也應該這樣,需要有自我身份的表達和認同,這一點體現在虛擬形象具體的形象和服裝搭配。
最後一點是多元化的創作者,創作可以分幾個層面,一方面包括捏臉、服裝搭配這種有較長存活時間的創作;另一方面像個人IP的打造,比如我是一個素人,進入一個語音聊天房,聽到大家都在聊天,靈感乍現後講了一個段子,在那一瞬間我其實也是在創作。
所以好的平台其實是能夠激發用戶參與其中的欲望,並促進用戶之間社交的。也正因如此,元宇宙不止有底層能力,還能提供K歌、看電影、一起玩遊戲等解決方案層面的能力,豐富客戶在元宇宙中的內容玩法。
Q6.實時互動已從過去的猜想變成了人人都能參與的現實,ZEGO即構科技如何看待實時互動技術所承載的價值?
Lily:對於线上交流來說,大家已經不滿足於信息的准確性和及時性,更多用戶可能會關注线上交流時的體驗和感受。對於這些需求,RTC技術其實已經打磨很久了,這項技術能夠支持用戶呈現出更好的表現。
比如視頻門戶的點播已經支持8K觀看,視頻通話是不是也可以支持4K的畫質?再比如說主動降噪已經是大部分連麥場景的基礎能力,那無規律的突發性的噪聲怎么去消除?又比如像語音聊天房之類的泛娛樂的場景,是不是可以精准的捕捉用戶的面部表情但不泄露真人的面貌,保護用戶的隱私?這些其實都是從用戶那裏收到的一些訴求,那基於這些訴求,我們提出了實時互動RTI來總結概括即構的能力,也是即構未來發展的方向。
相比於RTC,實時互動RTI並不以信息交換作爲唯一目標,而是通過可視化的服務體系去保障更好的互動體驗,在高效准確的基礎上滿足用戶的精神需求,也就是說通過數字化的方式共享時空。
雖然在物理上處於不同的地域,但我們依然可以一起去做某件事,去沉浸在同一件事中,去收獲這樣一種愉悅。這也是即構正在着力發展的方向,通過無限豐富的玩法提升用戶的體驗。
Q7.如何解決大量用戶的實時交互問題成爲了構建元宇宙的關鍵, ZEGO即構科技是如何突破這一難題,實現從RTC到RTI的質的飛躍的?
Lily:RTI全稱Real-time Interaction,它代表的就是爲了實現媲美甚至超越現實的實時互動場景下所用到的產品和技術的能力組合。除了最核心的RTC以及直播之外,還包括虛擬形象,AI視覺、狀態同步等能力。相比RTC,即構更強調互動,而不只是以信息的交換作爲唯一的目標,通過這種方式打造用戶所需的共享時空感受。
對RTI有三個要求。第一,畫質做到智能逼真;第二,音質做到身臨其境;第三,玩法能無限豐富。
對大部分客戶來說,可能會遇到一個問題,社交APP面臨着大量用戶實時交互的需求,但是市面上很多廠家的技術還不夠成熟。比如參加线上的虛擬演唱會,場景裏可能會有幾千人,每個用戶都可以參觀遊玩,當我聽到一首好聽的歌,想跟周圍的人一起歡呼鼓掌、合唱,我想开麥跟別人交流,但在這個時候有可能會因爲當前房間开麥人數已達上限,我就沒有辦法講話。這其實是對用戶體驗的一種傷害。即構希望能夠解決這樣的問題,並且現在也做到了。
在剛剛這個場景裏,有三個核心痛點,第一個是用戶體驗;第二個是企業本身的流量成本以及性能的問題;第三個是單個房間能容納的人數。
針對這些痛點,即構已經有比較成熟的解決方案,我可以簡單講一下,即構主要是通過做場景化的雲端智能選路雙策略,解決用戶的通話效率和差異化場景的問題,同時也幫助企業節省大量不必要的流量成本和性能开銷。
針對不同的場景,我們目前有兩大類策略。第一個,用戶是在可移動的、有空間坐標的場景裏面,在這樣的條件下,用戶更希望聽到近距離的聲音。這個其實很容易理解,就比如說在遊戲裏面,我們和隊友需要互相交流,但不需要關注其他用戶到底在交流什么。在這種情況下,大規模連麥就比較適用於距離選路策略下的產品。
包括虛擬演唱會、虛擬展會、以及一起看電影都是它的應用場景。在虛擬電影院裏,很多用戶一起去沉浸式觀影的同時,也有一定的社交屬性,比如和朋友討論劇情而不需要讓更多的用戶去聽到。
第二個,在傳統的語聊場景中可能沒有3D的概念,它只是一個大規模用戶連麥,用戶可能更希望聽到當前正在發言的用戶聲音。在這種情況下,大規模連麥就比較適用於語音活躍選路策略下的產品,根據當前正在發言的活躍用戶來選擇收聽誰的聲音,這個能力叫萬人RTC連麥,它比較適用於在线的研討會等場景。
這兩個策略就是去解決企業成本的痛點,在解決這兩個問題之後,我們還將單房間用戶的上麥規模突破到了1萬,那這樣就不用再擔心麥位受限而影響更多的用戶體驗。同在元宇宙的虛擬場景內,即構現在已經可以支持萬人狀態同步,在這個方面達到了行業第一的水平。
Q8.最後回到我們本期的主題,隨着創作者經濟的發展,UGC已經不是一個陌生的名詞,但是當前元宇宙行業還處於早期,那么Lily老師,您怎么看待元宇宙中的UGC呢?它離我們還有多遠呢?
Lily:這個問題其實是比較大的,我可以講一下我的個人想法。
首先,多元化的創作者對一個有活力的平台來說是非常重要的,但同時打造優質生態也是非常困難的,核心矛盾就是素材的制作,因爲要實現從2D到3D的轉變,其實難度很大,那如何形成UGC呢,這可能需要依賴兩個關鍵的問題。
第一個是需要低門檻的創作環境,需要有趁手的工具,比如像素時代誕生了美圖秀秀這樣的圖片編輯工具之後,可以看到很多關於圖片、圖文的創作。進入短視頻時代,有了趁手好用的短視頻編輯工具之後,越來越多的用戶加入到視頻創作者這個行列中,甚至從中獲得了經濟收益。所以在技術層面,我們需要給用戶打造便捷好用的工具。
第二點,提升用戶個人的創作能力和創作欲望。一方面是依賴整個行業的發展,同時依賴平台對用戶的培養。比如在短視頻創作的早期,平台要到處去挖創作者,教他們怎么去使用工具,甚至通過獎勵鼓勵他們發布視頻。
直播也一樣,最早一些頭部主播本身就會參與其中,如果說想讓更多素人主播加入其中,市面上很多頭部平台也花費了較大的精力,比如线下挖人找創作者、籤約、教他們怎么开播、怎么生產內容,這就是對於創作者的培養,通過這種方式讓更多的人加入到創作中。
剛剛提到的是大環境的背景,那在元宇宙的環境中,我認爲優質內容的創作可能是分兩類,第一個是形象的創作,第二個是場景的創作,我們最常見到的還是比如像捏臉、換裝等這種形象相關的創作。
目前,元宇宙基礎能力其實是比較成熟的,然而用戶心智和創作的能力還在培養中,只有少部分平台走到了市場最前端,同時在用戶捏臉以及換裝的形象創作過程中,很重要的一環是素材,元宇宙虛擬人的唯一性和用戶本身的相似性,以及用戶身份角色的表達,這些在很大程度上其實是依賴美術素材的多樣性,有了豐富多樣的素材,用戶才能夠說通過DIY捏臉、更換裝扮等方式去發揮更大的創造力。
所以場景其實是分兩部分的能力,第一部分是我們去搭建基礎的模型,讓用戶在這個基礎上去做一些二次創作;第二部分就是用戶本身也要參與到這種創作中來,進行更高級的創作。
對大多數的企業來說,做這件事情依然是有難度的。就像剛剛提的美圖秀秀、抖音、快手等像素生產工具,我們可以把它們看作是UGC的前提條件。C端用戶加入創作前,對於布局生產素材能力的低端企業,怎么低門檻地生產素材就是一個前置的條件。
即構的元宇宙引擎爲了解決這一痛點。一方面幫助企業去優化、提升生產效率;另一方面在美術素材這塊,我們也有豐富的基礎模型供客戶選擇,同時也和多家美術工作室達成了深度合作,有專業的元宇宙美術相關團隊提供長期穩定的服務,幫助客戶實現更多的深度定制。
與此同時還有素材管理平台、素材市場等,這樣一系列配套的工具和服務,都是爲了提升整個素材的供給效率,降低上新成本。即構也希望能夠和客戶共建豐富的、有活力的優質生態。
Q1:Lily老師怎樣看待實時互動賽道的崛起,未來會有多大的市場?
Lily:互動賽道其實是非常廣闊的市場,整個賽道裏可能有各種參與者,比如B端的技術服務商,即構可以向他們提供RTC底層技術以及一些解決方案,更廣闊的市場還是在C端,尤其像娛樂行業這樣的產業是有比較廣闊的發展空間。
現在很多客戶對元宇宙都有興趣,甚至在考慮將公司轉到這個方向發展,還有些客戶可能看好海外的廣闊市場,選擇做出海、做本地化,耕耘不同的業務場景。
除此之外,實時互動在政企工業等領域也能夠發揮巨大的作用,比如RTC可以用在安防相關的領域,或者可以通過實時线上的交流,向客戶展示產品、原產地,通過這種方式去建立企業生產者和消費者之間的更緊密聯系。
Q2:除了爲KTV、語聊等娛樂場景提供解決方案,即構還在哪些場景進行了探索?
Lily:即構去做KTV、看電影,玩遊戲,其實都是爲了豐富元宇宙的內容玩法。其實在語聊房直播時代,就已經有了這些方案,這些方案的本質和元宇宙相同,都是豐富用戶的聊天內容和場景。相對這些方案對用戶本身,尤其是對主持人的要求,對內容生產的要求也是非常高的。
基於這一點,即構已經打造了解決方案,讓用戶能夠共同參與某件事,同時在做這件事情的過程中,讓用戶去發揮自己的創造力。比如唱歌,每個人都能唱幾句,那在這種場景下也衍生出了很多的玩法,比如可以單唱,也可以付費點主播給我唱首歌,也可以跟主播實時合唱。
再比如說看電影,即構電影場景剛上线的時候,很多用戶可能不太能夠理解這個場景到底能給他帶來什么,但當他开始使用並了解接觸時,就會發現虛擬空間竟然也能找到喜好相同的人。
比如他們都喜歡懸疑片,然後在看這部電影的時候發現我們也同時看過另一部電影,他們甚至可以對這個電影中的某個情節進行討論。在這種場景下,用戶之間可以討論的話題就變得豐富起來,他們也可以相互了解各自的標籤,用戶之間的社交關系就自然而然緊密起來了。
Q3:對於社交產品來說,沉浸感和代入感哪個更重要一些?
Lily:我個人認爲沉浸感就是在3D空間裏,用戶會有一種真實到場的感覺。比如我在一片虛擬沙灘上面,這個沙灘首先是對线下場景進行還原,甚至虛擬大海裏還會出現一些浪花。除此之外,通過語音的方式也能獲得沉浸感,比如說近處的聲音大,遠處的聲音小,用戶能分辨這個聲音到底是從哪個方向傳來的,這樣能帶給用戶沉浸感的體驗。
代入感我自己個人認爲是一種角色扮演,它基於想象去獲得成績或者獲得某種體驗,舉個例子,比如劇本殺,首先要有代入感,要看懂這個本子,要假設自己就處在那個情境中,當有了這種角色的代入感之後,才能進入到這個故事情境中,由此獲得沉浸感。
所以我覺得這兩個詞其實是有關聯的,但又存在區分,哪個更重要可能還是要看業務場景。
Q4: 在構建元宇宙場景過程中有遇到過瓶頸嗎?
Lily:即構從开始做到現在確實遇到過很多問題,也一一去解決了,同時獲得了技術進步。比如在虛擬人技術方面,即構最开始做的時候遇到一個問題,就是虛擬人的表情怎么才能更真實自然。
2018年开始研究虛擬人時,是存在很多穿模現象的,比如表情隨動這塊細節功能,即構其實是做了非常多的優化,最早一版可能會存在表情不自然的問題,但是,即構及時發現了這些問題,同時不斷去做技術方案改進、調優。
到現在爲止,虛擬人形象已經解決了穿模的問題,我們甚至還完成了更多細節,比如說在3D場景中,有陽光照射時,虛擬人的頭發和皮膚可能會有光澤;同時在擺動頭部時,虛擬人的頭發、衣服也會跟着擺動。
我們做了類似的空氣動力學的隨動效果,通過大量的細節不停地迭代,獲得現在這樣靈活自然的效果。
那在場景這塊,最早的時候場景裏只能容納20個人,現在我們可以容納到萬人,這也是比較大的突破;包括我們的原型也是在不斷的縮小,現在可能就只有30兆左右,幾乎不會對客戶的業務產生大的影響;性能也在不斷調優,可以支持三年前的千元機。
即構在遇到困難時,都是不斷的解決它,才實現了元宇宙技術的突破。
Q5:除了抓住Z世代,即構在銀發經濟市場有什么樣的計劃?
Lily:基於國情,怎么做產品改造,怎么在這塊去提供更多的服務,其實一方面確實是出於社會責任感,另一方面這塊有巨大的市場空間。
即構的產品確實也服務過老年客戶,在沒有元宇宙以前,即構的线上KTV房在老齡化產品裏面是比較受歡迎的。退休的叔叔阿姨們,其實也需要豐富的线上社交生活,甚至有一些老年人社交產品對元宇宙也感興趣,那他們參與元宇宙的方式和大部分客戶差不多,只是在人物形象上面,我們會做一些特別的處理。
比如人物形象可以按照年齡去做一些適配,我們有中年版,有老年版,有銀發也有皺紋,這樣能帶給他們自我身份的認同吧。
元宇宙之心:非常感激Lily老師來到元宇宙三千問做客,也非常感謝老師能夠爲我們分析元宇宙UGC生態,以後如果有機會我們會再次邀請Lily老師來給大家講解元宇宙。謝謝大家,我們下期再見。
元宇宙正在將內容創作引入下一個時代,隨着Web3.0時代的來臨,全真互聯網能夠打造數據屬於用戶自己的互聯網,ZEGO即構科技創始人林友堯說,“打造趁手的生產工具和可靠的生產流程,讓更多的先行者加入到元宇宙實際價值的挖掘中來。”
雖然當前元宇宙場景還處於基礎發展階段,但隨着越來越多的內容創作者和平台的加入,元宇宙內容生態一定能煥發不一樣的生命力,相信即構科技將引領我們走向下一個內容數字時代。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。
標題:對話ZEGO即構科技, 如何助力企業探索元宇宙更多可能性?
地址:https://www.torrentbusiness.com/article/20954.html
標籤: