今天小編分享的科技經驗:全新虛拟人技術發布,蘋果原來還握着這麼多元宇宙大招,歡迎閲讀。
蘋果認知中的虛拟人乃至虛拟世界,都要以無限趨近真實世界作為目标
随着年末的到來,半年前蘋果在頭顯領網域的大招 Vision Pro 距離正式發售也越來越近。
雖然半年來,大家的目光都聚焦在 Vision Pro 可能帶來的全新沉浸式體驗上,但潛藏在其中關于虛拟人的探索亦有不少:
從五年前引領 3D 面部動捕的 Animoji,到上周發布的可以生成真人數字分身的 HUGS 技術,都展露出蘋果想探索出一條與眾不同虛拟人道路的決心。
而這些多年積累的技術,也都将在 Vision Pro 上迎來高光時刻——不得不説,在為元宇宙續命這塊蘋果是會拿捏的,以半年為周期穩定為元宇宙注入新的可能性。
1 全新技術 讓虛拟人無限趨近現實
蘋果最新發布的 "HUGS" 虛拟人技術,全稱為 Human Gaussian Splats,即人類高斯合成,這項技術基于 3D Gaussian Splatting(3DGS)和 SMPL 身體模型,通過兩種先進技術融合來創造出更加生動和真實的數字人物。
較之傳統的虛拟人生成技術,HUGS 的一個關鍵優勢在于其高效的數據處理能力,其僅需大約 2 到 4 秒的視頻(50-100 幀),就能生成一個完整的數字分身,大大減少了創建虛拟人所需要的原始素材。
當然目前 HUGS 在捕捉細節方面還有局限,不過通過算法,HUGS 能夠自動填充未被捕捉到的元素,确保了數字分身的整體質量。
此外,HUGS 的生成速度是其另一個優勢:蘋果發布的相關論文宣稱,HUGS 能在約 30 分鍾内完成數字人的生成,速度比當前市場上的其他同類產品快約 100 倍。
而在所需素材較少,生成速度較快的基礎上,HUGS 在渲染質量和速度上也有顯著提高:HUGS 能夠以 60 FPS 的速度實現高質量渲染,同時還能處理動态場景中的復雜挑戰,如避免偽影并協調動畫過程中的運動。
雖然動作設計有些鬼畜,但通過演示視頻可以看出,當前利用 HUGS" 技術生成的數字人在動作流暢性、人物拟真性上都已經趨近完成體。
這也宣示着蘋果在數字渲染領網域的一個顯著進步,特别是在動态場景中創建和渲染人類數字分身的能力上。因此在擁有 Vinsion Pro 後,通過相關技術快速生成數字人并在此基礎上開展多樣化應用也成為了可能。
除了潛在的與 Vinsion Pro 結合的可能性,HUGS 的這些特性也使其成為電影制作、遊戲開發、虛拟現實等領網域的一個有價值的工具,特别是在需要快速且高質量地渲染動态人類角色的場景中。
通過 HUGS 技術,創作者和開發者能夠更自由地實現新穎姿勢和視圖的合成,開辟數字創作的新可能性。
當然突破并非一蹴而就——近幾年,蘋果在虛拟人相關技術上進行的諸多探索,都一個個成為 Vision Pro 未來圖景的基石。
2 逐步積澱 空間計算穩健前行
回顧蘋果的虛拟人相關的動作,2017 年的 Animoji 無疑是其中的關鍵一步。
Animoji 首次亮相于 2017 年的蘋果秋季發布會,與 iPhone X 一同亮相的 Animoji 在彼時展示出了一種全新的互動方式:
這一技術通過 iPhone 的前置 TrueDepth 相機系統精确捕捉用户的面部動作,如嘴巴、眉毛和眼睛的運動,從而實時地将這些表情映射到獨角獸、機器人或貓頭鷹等各種動畫角色上。用户可以選擇不同的動畫角色來錄制和發送含有語音的動畫消息,這些角色能夠精準地模拟并反映用户的表情和聲音。
而後來發生的故事,我們已經很熟悉:随着技術的不斷進步,Animoji 也被運用到更廣泛的場景,如社交媒體和視頻制作上。同時其他同類產品也開始瘋狂湧現,通過面部捕捉生成自己虛拟形象的熱潮,每隔一段時間就會重復一次。
同時随着時間的推進,蘋果在虛拟人相關技術的探索上也更進一步——其中的許多技術細節中,都不乏 Animoji 的影子。
據目前的消息,在 Vision Pro 上蘋果會提前錄入使用者的 3D 面孔數據,生成出一個 3D 建模渲染的自己,也就是接近一比一還原的虛拟人,而為了讓虛拟人更加逼真,蘋果将采用一項名為 " 情緒識别 " 的新技術。
該技術旨在通過攝像頭,來分析用户的面部表情和情緒。根據專利内容,在這套系統中,需要使用面部識别技術來識别用户身份,以便提供定制化的操作,而這一技術其實也源自蘋果早年的積澱。
該技術的最初開發其實是為了應用在 Siri 上。彼時,為了減少語音請求被誤解的次數,蘋果試圖通過分析用户情緒來做到這一點,以進一步提高準确度。在早年的一份專利申請中,顯示蘋果正在開發一種全新的方法,通過在未來版本的 Siri 或其他系統中添加面部分析功能,來幫助 Siri 解讀用户提出的請求。
伴随着 Vision Pro 的問世,此前鋪墊的情緒識别技術無疑也即将迎來更大的用武之地。
除了在構建更拟真虛拟人上的努力,對于虛拟人潛在的應用場景,蘋果也早已開始探索。
蘋果公司最近獲得的元宇宙在線購物體驗專利,是一項旨在徹底改變在線購物方式的創新技術——在這個虛拟環境中,用户可以直接與各種虛拟產品進行互動,就像在現實中一樣。
該技術主要運用計算機生成影像(CGI)和擴展現實(CGR)技術,以提升數字零售體驗至新的層次,系統允許用户通過虛拟通信會話,實時與遠程銷售人員進行互動。
例如,用户可以從一個虛拟電視上拿下一部虛拟智能手機,體驗其所有功能,這些互動的方式讓虛拟對象看起來和真實物理對象一樣具有真實感。此外,專利還提出了在 VR 環境中的應用場景,包括虛拟零售商店、虛拟桌子和產品展示。這些應用不僅限于展示現實世界中的產品,還可以包括顯示歷史地點或虛構場景等虛拟位置。
通過這項專利,蘋果旨在解決在線購物中缺乏即時反饋和互動性的問題,使用户即使在家中或任何遠程環境中也能享受到類似面對面購物的體驗。用户可以通過簡單的手勢啓動 CGR 環境中的零售體驗,或互動體驗虛拟產品演示,同時銷售人員也可以遠程操縱產品來突出其特性和功能。
在很近的将來,通過 Vision Pro 用户就能夠體驗到高度真實感的虛拟人物,還能在更加沉浸式的環境中與之互動——無論是在娛樂、教育還是遠程溝通方面都将開辟新的體驗方式。
3 技術融合 未來比想象中更近
至此,蘋果的虛拟人路徑已經清晰展現:那就是以真人數字分身作為主要方向,通過完善動作、細節、情感、場景等,使數字人無限趨近于真實。
有别于當前的超寫實虛拟人或卡通式虛拟人,蘋果選擇的道路更接近于通過真人素材構建真人數字分身的路徑。
雖然當下的真人虛拟人已經可以做到十分逼真的程度,但其應用更多停留在 2D 平面,也就是手機、電腦等顯示屏中,生成的内容以口播為主,需要出鏡的範圍也基本局限在上半身,且以面部動作為主,身體其他部分動作有限。
而在 Vision Pro 即将開啓的空間計算時代中,對真人數字人以及其全身動作拟真性的要求會達到前所未有的高度。
此前 Meta Horizon Worlds 中卡通人物呈現的低幼感,與只能顯示虛拟人物上半身的詭異感,成為其發展過程中的兩大重大阻礙:
一方面低幼感的形象會讓虛拟空間天然具備更多遊戲性,從而阻礙其在生產力上的拓展;另一方面顯示人物上半身的詭異感會很輕易地破壞沉浸式體驗。
顯然,蘋果認知中的虛拟人乃至虛拟世界,都要以無限趨近真實世界作為目标。
iOS 17.2 更新後正式亮相的空間視頻錄制功能同樣是實現這一目标的關鍵一步。雖然當下該功能只能實現 1080P 60 幀的内容錄制,但根據已有的體驗反饋,其已經可以實現接近現實世界的沉浸感。
雖然 HUGS 目前生成數字人 30 分鍾的時間依然略顯漫長,情緒識别功能的具體應用效果、在線購物等場景能在多大程度上符合人們的期待都還要等 Vision Pro 發售後揭曉,空間視頻 1080P 的分辨率限制離頭顯對于内容 8K 乃至 16K 的高标準要求還要一定距離,但一個關于真人數字人與真實場景構建的虛拟世界的拼圖已經越來越多。
在相關技術進一步完善與融合後,只需要一段視頻就可以構建一個場景真實、人物逼真的虛拟世界的未來,其實比想象中更近。