今天小編分享的科技經驗:十秒鍾生成一只寶可夢,《幻獸帕魯》AI 抄襲實錘了?,歡迎閱讀。
作者 | Li Yuan
編輯 | 鄭玄
2024 年開年,幻獸帕魯抄襲的 drama 從遊戲圈一路争議到了 AI 圈。 小團隊,無經驗,快速開發出精美的遊戲,遊戲資產和寶可夢相似又不相同,幾個關鍵詞的疊加,迅速引爆了人們的想象。
幻獸帕魯遊戲社長溝部拓郎(Takuro Mizobe)将一個充滿了畢業生和愛好者的團隊,能夠快速研發出一款高復雜度的遊戲稱為「巧合」,而大家卻不買賬——這個巧合的名字該不會是 AI 吧?
AI 圈的人也沒閒着。昨天,我就看到了兩條相關的演示視頻——使用寶可夢的圖片,十秒鍾就能生成一個像模像樣的寶可夢的 3D 模型,可以直接導出進入遊戲使用。
這,AI 抄襲實錘了?帶着這樣的好奇,我去和兩條視頻的創作團隊分别聊了聊,AI 生成 3D 資產,現在已經做到了什麼程度。
十秒生成寶可夢風的怪物
兩條視頻中的一條視頻,來自 VAST 公司。2023 年成立的 VAST 公司,在去年年底上線了通用 3D 模型 Tripo,目前在 tripo3d.ai 的網頁上和 Discord 上都能體驗相關的 3D 生成衣務。
類似于圖片生成的 Midjourney 服務,用戶只需要輸入關鍵詞或者上傳一張 2D 圖片,Tripo 就能在 5-10 秒内直接生成 4 個比較初步的 3D 模型,而用戶滿意的話,則可以選擇進一步生成精度更高的 3D 模型。
圖片來自 VAST AI 演示
在視頻裡,用戶輸入了「voxel rock monster」(體塑風岩石怪物,體塑風的風格有點類似于樂高積木。)的提示詞,在五分鍾之内,平台就生成了一個粗版的綠色岩石怪物的 3D 模型。
而再通過平台即将上線的一些插件對貼圖的呈現風格進行微調後,生成的綠色岩石怪物,能夠變得更像 Minecraft 遊戲中的風格,可以直接被導入 Minecraft 遊戲中進行使用。
除了文生 3D 之外,Tripo 也能進行圖生 3D。視頻結尾,一排寶可夢風格的兩腳獸,四腳獸,飛禽,在 Minecraft 世界裡組成了一個微觀小花園一樣的建築群,顯得詭異又壯觀。
而另一條視頻,則來自影眸科技公司。
影眸科技從 2016 年開始進行人臉采集生成 3D 模型的業務,積累了許多人臉方面的 3D 數據,在人臉生成 3D 模型技術方面有格外心得。據 CTO 張啟煊介紹,其人臉生成 3D 的服務,應該是目前國内 3D 生成裡面唯一一個走進遊戲生產端的產品。
而在通用 3D 模型生成方面,目前,影眸也開放了通過聊天生成 3D 模型的服務 ChatAvatar。此次視頻中,展示的則是即将上線的 Rodin Gen-1 模型的能力。
影眸科技 Demo
視頻中主要展示了圖生 3D 的能力。演示者直接拖拽了一個寶可夢的圖片到平台中,通過簡單的點選生成了提示詞——比如「生成人物」「光滑」「對稱」,在十秒鍾之内就生成了一個白模(只有模型而沒有材質和紋理等)。
影眸科技特意強調了生成的模型十分光滑,而且能做出更加尖銳的結構。「可以看到第一只寶可夢的尾巴上的刺結構很清晰,這是在之前的 3D 生成中幾乎做不到的。」視頻中講到。
影眸科技表示,十秒鍾生成的模型仍然較為初步,正式的版本裡能夠生成比視頻中清晰度高 4 倍的模型。
技術突破來自近 3 個月 幻獸帕魯還用不上
AI 生成 3D 模型都已經發展到這個水平了?用寶可夢的圖片,幾秒鍾就能生成一只寶可夢的 3D 模型?那幻獸帕魯的抄襲實錘了?
帶着這樣的疑問,我采訪了 VAST 公司的 CTO 梁鼎和影眸科技的 CTO 張啟煊。出乎我意料的是,兩人的答案相當一致,幻獸帕魯大概率不是用 AI 做出的 3D 模型。
在幻獸帕魯的 AI 抄襲門中,一個重要的「實錘」來自 X 平台上一位用戶 byo 對于對幻獸帕魯的 3D 模型與寶可夢的 3D 模型,進行的對比。
幻獸帕魯的 3D 模型與寶可夢的 3D 模型的對比
可以看到,幻獸帕魯的 3D 模型雖然與寶可夢的模型不完全相同,但在對一個自然不存在的神奇動物的設計上,其相似性還是很難解釋。
暴雪前遊戲設計師 Eric Covington 直接表示,「意外地」創建比例如此接近的復雜模型網絡實際上是不可能的。」
假如幻獸帕魯的确進行了一些灰色操作,模型的相似可能來自于直接抄襲——解包寶可夢遊戲,對于其中的 3D 模型進行小範圍的拼接變形和重構,那可不可能是訓練材料源于寶可夢模型的人工智能生成的呢?
畢竟,幻獸帕魯的社長,很早就對使用人工智能來避開版權問題,表現出了極大的興趣。早在 2022 年,他就曾在推特上表示:「經過人工智能的過濾,一個影像将變成新的圖,那麼版權問題也許會得到解決?我驚訝地發現世界實際上正在朝這個方向發展。在大約 30 年内,公眾對于版權的看法,可能會發生很大變化。」
更加讓人產生懷疑的,是 2021 年 12 月,幻獸帕魯的社長轉發 BuzzFeed 工程師使用一種名為 ruDALL-E 的方法全自動生成的寶可夢,表示 AI 生成的寶可夢已經讓他分不清哪個是真的寶可夢了。
幻獸帕魯的社長推特發言
2022 年,團隊甚至還開發了一款名為《AI:藝術仿冒者》的遊戲——是的,就叫這個名字。遊戲機制其實是一個 AI 繪畫版本的誰是卧底。玩家拿到詞語之後,自己添加一個新詞讓 AI 畫出一副相關的畫作,最後玩家根據 AI 畫出的畫作,猜出誰是卧底。這起碼證明團隊到 2022 年,在 AI 生成影像方面,有一定的技術積累。
不過,在觀察了幻獸帕魯遊戲的最終表現後,兩位處于 3D 模型生成業界應用的領網域前沿的專家,最終還是向我表示,AI 的 3D 模型生成技術,目前還不足以支撐這樣的應用。
「可以看到,最終的遊戲中,模型表面非常光滑對稱,而且每個模型都具有復雜的動作。而市面上已經上市的產品裡,都不具有這樣的能力。」VAST 公司的 CTO 梁鼎表示,「目前能夠提供給大眾的產品中,基本上能夠生成的都是靜态的模型,不具備可驅動的能力。而讓模型的手、腳等等能夠動起來,其實工作量非常大。尤其是不同種類的幻獸,有的有翅膀沒有的沒翅膀,有的兩只腳有的四只腳,沒有辦法做統一的比較好的處理,在 AI 上也沒有一個很好的解決方案。」
幻獸帕魯宣傳頁 圖片來源:Steam
影眸科技的 CTO 張啟煊也提到了光滑性的問題:「目前市面上的很多產品,因為采取的技術路線的問題,生成的 3D 模型,把貼圖去掉之後,模型其實是一團漿糊,沒有辦法做出很尖銳的結構。」
除此之外,他還提到了性價比的問題。「AI 做 3D 模型,始終是完成前 60-70% 的内容。而對于帕魯這樣的遊戲來說,其實大量的工作來自于最後對帕魯的細節調優,比如某只腳的位置設計上。在 AI 生成的 3D 模型上進行修改,要比從數據庫裡、從資產庫裡找一個比較好的模型來改更復雜。後者只需要找一個入門的模型師就可以。」
如果只是對寶可夢的模型進行了人工的更改的話,似乎也更能解釋遊戲的模型和動作開發速度,為什麼遠高于行業的平均速度。
X 用戶名為 @Cecilia Fae 的 3D 動畫工程師,深度參與了幻獸帕魯「打假」,發了視頻解釋了幻獸帕魯的 3D 模型和寶可夢相似的可能原因。
簡要而言,将 3D 模型的動作進行復制粘貼是很簡單的,但是如果兩個模型之間的外貌,比例都不一樣,復制粘貼的效果會很差。但兩者的比例越接近,這樣的粘貼就越簡單,只需按一下按鈕就可以復制和粘貼動畫。
也就是說,如果幻獸帕魯的團隊只是使用人工的方式對寶可夢的模型進行了簡單修改,會大大加速其研發時間。采取人工智能的方式,反而不見得性價比很高。
「一定要做的話,一些比較先進的團隊或許能夠做出來,但是需要整個團隊為它服務。而這個技術突破,也是近三個月才能比較接近實現的。」梁鼎表示,「幻獸帕魯遊戲很明顯不是近三個月做出來的。」
人工智能或将很快将進入遊戲研發中
雖然幻獸帕魯大概率并沒有使用 AI 對 3D 模型生成進行「降本增效」,不過兩家 3D 模型生成的公司的技術展示,已經讓我看到:3D 模型生成領網域在飛速進展,不久的将來,類似的技術一定會被應用到遊戲中。
而幻獸帕魯的母公司,對于應用 AI 技術到產品中來制造爆款遊戲,也毫不避諱。
其新作《Never Grave: The Witch and The Curse》上周剛剛發布預告。預告中直接表明,作為一款 Roguelite 的遊戲,在這款新作中,玩家将能夠在随機生成的地下城關卡,與敵人進行戰鬥。很明顯,随機生成的關卡中,一定使用了不少 AI 技術。
新作仍然背上了抄襲縫合的指控,此次指向的則是空洞騎士。空洞騎士的續作《空洞騎士:絲綢之歌》已跳票多年,因此不少網友戲稱「誰先出誰是絲綢之歌。」
雖然此次幻獸帕魯的 AI 抄襲門大概率是一個烏龍,AI 技術(或許加上一些縫合操作)加速遊戲開發節奏,改變遊戲世界,已經是可以看到的趨勢。
帕魯公司新作
我向兩位技術專家詢問了目前 AI 3D 模型生成在遊戲界的使用情況。
影眸科技的 CTO 張啟煊表示:「現在比較靠譜的使用方式是用這項技術來做原畫,來驗證;想要的概念,進行相關的策劃。」除此之外,在人臉垂類上,影眸科技的技術已經進入了生產管線。
而 VAST 公司的 CTO 梁鼎提到,一些遊戲公司會考慮在一些不是很顯眼的地方,使用 AI 生成的 3D 模型。「比如一個房間裡角落裡的沙發,散落的吉他等等。」
除此之外,也有一些先鋒遊戲,專門利用 AI 能很快生成 3D 資產的特性設計遊戲:Tripo Go 就是這樣一個小遊戲,核心玩法就是一個角色不斷吸收新的物品,每吸收一個物品就能變身成新的樣子。不考慮角色必須精致平滑,關鍵點在于有趣和快速生成。
對于未來的大規模使用,張啟煊提出了一個想法:「2D 的圖片生成目前已經很成熟,但 3D 生成因為數據量不夠豐富,自由度小很多。如果能夠通過 2D 生成生成豐富類型的圖片,再用 3D 生成轉化成 3D 模型的話,感覺可以做出一些新的玩法。」
梁鼎還提到了目前 3D 模型生成還需要突破的幾個方向:「一方面是幾何上更加光滑、對稱、平整,一方面是讓模型能夠動起來。另外 PBR 的效果,目前也是 3D 模型生成需要做的更好的地方。」最後一點指的是,如果生成一個類似于手機這樣的真實物品,如何讓塑料的手機殼玻璃的手機螢幕同時在一個自然環境下反光,還顯得很真實,對于目前的 3D 模型生成是一個難點。不過如果制作一個幻獸帕魯一樣的遊戲,則這樣的問題并不關鍵。
最後留下的一個問題是:未來用 AI 生成的 3D 模型做遊戲,會面臨版權問題嗎?
對此,我咨詢了隆安灣區 AI 法律研究中心主任陳煥律師。
他表示,遊戲中一些屬于「公有領網域」的要素表達,不太涉及版權問題。比如可達鴨,原型是鴨嘴獸,那麼鴨嘴獸的一般特征就屬于「公有領網域」的表達。
對于遊戲角色是否侵權的判斷,則要看作品是否與在先作品構成實質性相似,判斷方法包括「抽象分離法」和「感覺測試法」。
AI 生成的寶可夢,很明顯還是會與原來的寶可夢觀感相似。但 AI 生成的寶可夢,可能不會和原來的模型產生重合,或者能夠直接被溯源到原模型。在這樣的情況下判斷實質性相似,目前還沒有相關判例,可能需要看未來法院在個案上的一些判斷。