今天小編分享的科技經驗:一句話生成一分鍾視頻?元宇宙的救星果然是AI,歡迎閱讀。
圖片來源 @視覺中國
文 | 元宇宙新聲,編輯|高樂
作為一個在公眾視野中起起落落的概念,元宇宙所承載的對未來虛拟世界無限的想象總讓人感覺若即若離:
構建一個生動、豐富且充滿互動的虛拟環境是元宇宙概念誕生起就面臨的挑戰,成本、技術、創意等諸多因素都在限制着元宇宙的發展。
雖然最近一年多以來 AI 技術突飛猛進,但在協助元宇宙虛拟世界的構建上,一直沒有太大突破。
但 OpenAI 最新發布的視頻生成模型 Sora 展現出了前所未有的潛力,不論是構建虛拟視頻還是虛拟空間,Sora 都有了巨大飛躍。
AI,這次真的一夜之間成為了元宇宙世界的救星。
01 能視頻生成,就構建元宇宙場景?
對于這樣一個颠覆性創新,先不做過多贅述,直接看療效:
這段視頻的提示詞為:" 幾只巨大的猛犸象踏着白雪皚皚的草地走來,它們長長的毛毛在風中輕輕飄動,遠處覆蓋着白雪的樹木和引人注目的雪山,午後的陽光灑滿了縷縷雲彩,遠處的太陽發出溫暖的光芒,低相機視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動物,并具有美麗的攝影和景深。"
這段視頻的提示詞為:" 美麗的雪城東京很繁華。鏡頭穿過熙熙攘攘的城市街道,跟随幾個人享受美麗的雪天并在附近的攤位購物。美麗的櫻花花瓣随着雪花在風中飛舞。"
這段視頻的提示詞為:" 動畫場景的特寫是一個毛茸茸的小怪物跪在一根融化的紅色蠟燭旁邊。藝術風格是 3D 和現實的,重點是燈光和紋理。這幅畫的氣氛是一種驚奇和好奇,怪物睜大眼睛、張開嘴巴凝視着火焰。它的姿勢和表情傳達出一種天真和俏皮的感覺,就好像它第一次探索周圍的世界一樣。暖色調和戲劇性燈光的使用進一步增強了影像的舒适氛圍。"
幾條視頻展示出的 AI 視頻能力已經很明顯:
Sora 能夠基于文本描述準确生成高度逼真的場景,同時融入豐富的想象元素,打破了以往 AI 視頻内容創造的限制。
首先是長時間、一鏡到底的視頻生成。與當前市面上的其他 AI 視頻生成工具相比,Sora 能夠生成長達一分鍾的視頻,且在整個視頻過程中保持高度的一致性和連貫性,克服了此前同類工具的最大缺陷。
同時 Sora 還能實現復雜場景和角色的準确描繪。在創造包含多個角色復雜場景的同時,Sora 能夠較為精确地描繪出動作類型、對象和背景的詳細信息,甚至一定程度上實現角色的情感表達。
去年,這些問題還是 AI 視頻内容生成領網域面臨的最大挑戰。然而,今年開年不到兩個月的時間,Sora 就已經證明了自己克服這些挑戰的能力。
此外,Sora 還有許多令人頗感意外的亮點:
首先是其展示出了對電影拍攝語法的自發理解,能夠在不同鏡頭之間自然過渡,推進故事的發展;同時,其對于動物毛發等細節的逼真表現,也顯示出其在視頻生成技術上的細致入微。
既然 Sora 可以生成這麼多風格不同的連貫視頻,那麼更進一步的虛拟空間、虛拟世界構建自然也存在可能。
事實也确實如此,而且 AI 生成虛拟世界這一天的到來,或許會比想象中更快——正如去年的許多人也不曾預想到 AI 視頻内容生成的發展會如此迅速一樣。
02 元宇宙場景搭建,不再遙遠
就在發布 Sora 的同一時間,OpenAI 發表了一篇名為《Video generation models as world simulators》(視頻生成模型作為世界模拟器)的論文。
論文揭秘了有關 Sora 的更多關鍵信息,例如 Sora 可以生成任意分辨率和長寬比的視頻(高達 1080p)。此外 Sora 還能夠執行一系列影像和視頻編輯任務,從創建循環視頻到及時向前或向後延伸視頻,再到更改現有視頻中的背景。
其中 Sora 的 " 模拟數字世界 " 能力對于元宇宙的發展将起到關鍵性作用。
目前,Sora 已經能夠在像《我的世界》這樣的遊戲中渲染世界及其動态,并控制玩家角色,在此類虛拟空間構建平台中,Sora 幾乎像一個數據驅動的物理引擎,而非僅僅是一個創意生成工具。
這表明,通過 Sora 驅動虛拟空間的全自動搭建已經在逐步成為現實。
從目前的情況來看,Sora 對元宇宙的颠覆性影響主要體現在兩個方面:首先,它能夠直接根據需求生成虛拟視頻,迅速構建元宇宙所需的場景;其次,它展現出生成可供深入探索的虛拟空間的潛力。另一方面,其有望直接生成可以深入探索的虛拟空間。
這意味着不論從技術層面、社會層面還是文化層面,元宇宙都将進入全新的發展階段。
在技術層面,對于元宇宙的建設者來說,快速搭建豐富多樣的虛拟場景變得前所未有地容易。傳統上,創建逼真的虛拟環境需要大量的時間、人力和資源投入,而 Sora 的技術可以大大簡化這一過程,使得元宇宙的擴展和多樣化成為可能。
這不僅能夠加速元宇宙的構建進程,還能夠降低進入門檻,讓更多的創作者和開發者有機會參與到元宇宙的構建中來。
同時,在未來此類技術将不僅能夠生成靜态的虛拟場景,還有望直接生成可深入探索的動态虛拟空間。這些空間不僅僅是視覺上的呈現,而是可以與之互動、探索和體驗的完整虛拟世界。
元宇宙中的空間将不再是簡單的背景或設定,而是充滿了物理規則、動态事件和互動元素的生動世界。這将極大地豐富用戶在元宇宙中的體驗,使其不僅僅是觀察者,而是能夠實際參與和影響虛拟世界的發展。
社會層面,AI 技術的進步将使元宇宙能夠提供高度個性化的體驗,根據每個用戶的偏好、歷史行為和社互動動來定制内容和互動。這種個性化不僅限于内容推薦,也擴展到元宇宙中的角色、環境和故事情節的定制。
同時這樣的變化還會催生出新的社互動動形式,如 AI 驅動的虛拟角色與人類用戶之間的互動,或者通過如在線演唱會、教育課程、社交聚會等虛拟活動連接全球用戶。
文化層面,就像自媒體、短視頻時代對傳統傳媒形成衝擊一樣,虛拟内容創作門檻的降低,無疑會進一步衝擊傳統影視業的發展,同時,更多個體和文化背景的人們能夠創作和分享自己的故事,促進全球文化的多樣性和交流。
此外,元宇宙社群的真正興起也會帶動全新的虛拟文化興起,這種文化将完全從元宇宙中誕生、發展和傳播,形成獨特的文化标識和社區歸屬感。
03 未來已來,但挑戰依然
當然,在關于未來的暢想越來越具體的同時,對于 AI 構建元宇宙時要面臨的種種問題與挑戰,也到了亟待解決的時刻。
首先是技術準确性的問題,Sora 在渲染復雜場景和細節(如食物的咬痕或玻璃破碎的細節)時依然存在局限。這種局限性不僅影響生成内容的真實性,也可能限制其在某些應用場景(如法醫分析或科學研究)中的有效性。
此外模拟現實世界中的物理規則對于 AI 來說仍然是一個挑戰,這反映了當前 AI 技術在理解和模拟復雜自然現象方面的限制。
而除了技術上的問題外,個人形象濫用對肖像權、隐私權的侵犯;現實與虛構界限的模糊,逐步侵蝕公眾對信息真實性的信任;傳統的安全防護和欺詐檢測方難以應對更加精細和逼真的虛假内容,從而導致詐騙等案件更加頻發等,都要求政府、教育機構和技術公司共同努力,提高公眾對這類技術的理解和鑑别能力。
這些問題雖然已經是老生常談,但面對技術的突飛猛進,如何更好地用規則來規範技術的發展,已經變得迫在眉睫。
該如何面對這些進步對社會、文化和倫理帶來的深刻影響?如何吸取上一輪元宇宙發展的失敗教訓,借助 AI 真正營造一個開放、包容且充滿多樣性的虛拟世界?
這都需要元宇宙的各個相關主體負責任地探索與創新,以确保共同打造出一個既豐富又充滿互動,同時安全的元宇宙,賦予其更深層的意義。
AI,這次确實成為了元宇宙的救星,但元宇宙發展中要解決的問題,卻并沒有減少。