今天小編分享的遊戲經驗:“别再尬吹AI能降本增效了”,歡迎閲讀。
The following article is from GT遊戲人互助 Author 成志@GameTrigger
00
前言
降本增效:AI會取代原畫嗎?美術已節省xx人天
xx遊戲:懷疑使用AI,玩家聲讨、廠商道歉
xx公司官宣推出大模型,融資xx萬美金
萬字長文解析:英偉達又搓出什麼新核彈
......
在過去的200多天,也許你已然對這些标題麻木無感、甚至有些PTSD,但依然會有種不真切的迷離感——怎麼AI又火了,這是下一個元宇宙/Web3嗎?遊戲難道因此更好做、更好玩了嗎?
抱着如上疑惑,作為專注遊戲行業的投資人,秉持着好奇與求真的态度,筆者走訪了海内外遊戲開發者、AI研究員、AI創業公司,一路能聽到關于"AI遊戲"至少10種不同的定義(堪比20~21年人均"二次元"的盛況)。為了促進跨界交流,共同探索"AI遊戲"究竟是什麼,也曾在22年12月舉辦過AIGC主題的Game Jam。
結合研究與實踐,希望在這個信息過載的時刻,能為行業分享些接地氣兒的觀察、提供更AI原生的遊戲思考和腦洞,少一些無謂的FOMO——畢竟,無論技術如何迭代,遊戲好玩才是硬道理,審美好、懂設計、懂開發的遊戲人總是稀缺的。
01
舊話題裏的新鮮事
開源生态、二次元同人文化、開發者與創作者共創,促成生成式AI在創作圈的繁榮。遊戲,作為視聽互動的集大成者、也是變現效率極高的產品形态,同時有相對更温和的包容度,其土壤天然适合生成式AI的探索。
以影像生成為例,時間撥轉回2022年8月,Stable Diffusion方才問世,開源之火就迅速點燃了創作者的好奇心。在随後的10月,NovelAI推出基于Stable Diffusion和530萬張Danbooru影像訓練的文生圖模型,數日内蹿紅,但很快被意外破解。
彼時,互聯網大江南北都流轉着Vtuber區UP主秋葉aaaki的本地部署教程,同期《元素法典(1)(1)(2).pdf》也傳遍了大大小小的社群。或許最初這都不過是圖一樂,但在一票ACG相關創作者的努力下,文生圖/圖生圖又更上一層樓——曾開發出Waifu生成器的Spellbrush聯合Midjourney推出專注美少女的Niji Journey,年輕牌佬、YGOPro2作者鼓搗出ControlNet。
有趣的是,這輪生成式AI的主要傳火者并不在曾經設想的工業界、機器人,而是創作領網域,尤其在二次元同人圈。畢竟,相較于管線更成熟、容錯率低的工業需求,同人創作擁有相對更好的包容度、也有更濃的幻想和創作欲。
于是,擅長整活兒、常年混迹社區的愛好者紛紛轉型煉丹師,眼下B站首頁不乏"AI角色唱歌"、"AI小草神舞蹈";在HuggingFace的開源生态裏,也有不少老二次元工程師貢獻項目模型。
萬眾矚目的Character.AI,ACG類角色的調用量遠超其餘類型——畢竟能跟屑狐狸聊天,能獲得5t5陪伴,為什麼不放飛下自我呢?這波,二次元上大分,社區文化大勝利
而在所有的文娛創作中,遊戲,無疑是視聽互動的集大成者、也聚集相當多創作和技術人才,且F2P網遊的商業模式又早已被确立,因此被眾多從業者關注,各界多有"遊戲是AIGC落地的第一站"的觀點。
不過,在生成式AI浪潮來臨前,遊戲+AI本身也算不得什麼新鮮事。從NPC/怪物決策講,最普遍的無非行為樹、有限狀态機,也有較難設計、不甚常用的GOAP;生產流程上,不乏AI減面、自動展UV、網文生成器等工具;回到傳統的強化學習,雖限于少數重度PvP、三消等場景,但也較為成熟;即便跳出AI,諸如Houndini+SD等程式化生成工具,使用率即便較低,但也有點年頭。那如今燥熱的「生成式AI」究竟有什麼新活兒?
回歸「生成式AI」的發展,已有相當多科普梳理,在此不再贅述。一言以蔽之,自此不需要再為特定任務做專項訓練、也無需像傳統NLP得先拆分子任務。通才大模型在少量Prompt指令下,能結合上下文學習,可勝任相當多生成性工作,而不只是曾經簡單的翻譯理解(AutoGPT甚至可以幫你寫Prompt,長期來看,Prompt也可能只是指令互動的過渡媒介)。
同時,在有點兒「暴力美學」的縮放法則(Scaling Law)加持下,高質量數據和大量參數可以湧現出推理能力,如果加入其他模态的數據,還能相互轉換,甚至上半年的GPT-4、微軟KOSMOS-1還能讀懂梗圖。
就着"生成"和"推理"兩大關鍵能力,也衍生出了「降本增效」的AIGC工具派和「原生體驗」的AIGC遊戲派。
對于「降本增效」而言,抛開上市公司喊話大模型的市值管理行為,工具确實有一定效果,但當前仍無法滿足對可控性和容錯率的高要求。而對比以往"渠道迭代、產品質量為王、小團隊自研自發成為可能"等行業價值鏈的結構性變化,目前的生成式AI尚且還沒有清晰的"颠覆"路徑。
此外,遊戲趣味和盈利能力也并不與投入資本的多寡呈線性的正相關——巨制會翻車、小品也能爆。如果不談如何創造新體驗,只聚焦工具提效,可能不免就會陷入"不過是将14人天的立繪設計縮短到10人天,将0.5人天的綁骨骼縮短到0.2人天,但還是不符合賣點、玩家覺得不如《O神》"的窘境。
因此,在混沌之初,更值得探讨的還是"AI原生遊戲會長什麼樣",能否為玩家帶來新樂子,或者提供新的變現模式——畢竟,遊戲體驗永遠是内核,作品不夠好玩,玩家不願買賬,聊再多"降本增效"也無濟于事。
02
原生體驗
AI原生遊戲,有兩種截然不同的路徑——第一種是純粹的遊戲思維,即選擇有相似思想的原型,先做個好玩的遊戲,将AI視作錦上添花和樂趣延伸;第二種則是遊戲化的互聯網產品思維,即用"遊戲化"包裝泛娛樂需求,追求傳播和增長裂變,AI扮演提供樂子的工具。
聊起遊戲本身,也有人聽到AI創新後眼前一亮,仿佛無限關卡近在眼前,再搞個UGC編輯器,豈不就是遊戲永動機——赢麻了。
但很遺憾,後文将説明AI原生遊戲并不等同于無限生成内容的策劃機器人,更不是搞個更簡易的編輯器讓玩家代工。在這裏,筆者先提出一種思想——AI原生遊戲将發生從"設計師創造樂趣"到"玩家自主創造樂趣"的範式轉換,即廣義上的UGC,AI原生遊戲的趣味得由開發者、AI、玩家三者共創。
談及遊戲創新的範式,筆者粗略地先分出三種路徑:①想到但做不到——通常卡在設計/技術;②做到但不夠好——最為常見的微創新;③壓根沒想到——神來一筆/有時是品類級機會。
其中,第一點和第二點尚有讨論空間,即生成式AI的推理特性能否優化已有體驗,拓寬其樂趣。但聊到第三點,就很難僅拿着概念來做無中生有的空想,即能以xxx-like命名的創新往往和機制、互動相關,得經歷長時間推敲和驗證才能成型,與技術更迭并無直接幹系。故全新體驗的确有可能出現,但暫不在本文讨論範疇中。
回到第二點"做到但不夠好",歷來是業内最務實的話題,但要跨越這難關,對多數網遊而言,最棘手的還不是去想那些凸顯差異化的小設計,而是處理"内容產出速率低于玩家消耗速率"的窘境。只不過在普遍如此的當下,玩家和研發就"長草"和"坐牢"達成了一種微妙的相互妥協——但個中原因僅僅是内容少嗎?仔細一想也不對。
為了能繼續推進劇情/畢業喜歡的強力角色,即便痛罵一頓,還得回去反復刷材料
對于側重局内體驗的遊戲,刺激長留和付費的往往是精雕細琢的高星角色、BOSS戰、主線演出、一波三折的關卡,肯定不是量大管飽的填充物(此處點名看似無限的Roguelike副本、看似随機的日常任務)。哪怕儲備了一系列高質量内容,也得講究"物以稀為貴",釋放節奏要論疏密,不會一味地高強度更新——總不能每周一個新卡池等着被罵吧。
對于側重局外養成的遊戲,關卡/戰鬥又更多是驗證養成的一道場景,爆出神兵、刷齊套裝、湊足Build的數值反饋更重要,其留存内核顯然也不是從多堆幾關小怪能解決的。
因此,内容過速消耗的關鍵似乎并不在多寡。我們常常談及的工業化產線也并不意指量大管飽,只是盡可能保質、保量、保時地產出版本,滿足玩家對長期驅動力的追求。
從這個視角來看,AIGC能無限生成内容的幻想,除了強化學習在極少數MOBA/FPS的AI Bot、純關卡驅動的三消、需要陪玩的菠菜有價值外,其餘品類就總缺了點立足之處,還會陷入"算法人才難覓、數據集有限、訓練成本高昂,不如招個資深策劃"的ROI悖論。
筆者認為,更好的思路,可能是從"設計師創造樂趣"到"玩家自主創造樂趣"的範式轉換——即廣義而言的UGC,這其實與生成式AI天然契合。不過這裏的UGC≠搞編輯器,不是去硬抄《蛋仔派對》《Roblox》,其實質是開發者設計好互動方式、規則機制和反饋邏輯,而将具體樂趣的創造放權給玩家。
最典型的例子就是麻将和樂高的思想。
麻将,也可代指一切優質的PvP遊戲,在基礎規則既定後,借助随機性和風險博弈,雀友的發揮決定了樂趣多寡。只要還能肝,赢家和輸家都想無限地再開一把,且還自帶傳播性。
樂高,也可代指一切有沙盒創造屬性的遊戲,本質是以物理規則為支撐,定義了基礎元件的連接方式,而無論是創造還是破壞都有其樂趣。同時,設計重點不在于玩具制造本身,而是如何提供合理的反饋,畢竟空有屠龍刀而無龍可屠就多少欠了點意思。不過一旦成型,千人千面,玩家總會找到獨屬自己的樂趣所在。
麻将:頂級UGC遊戲,樂此不疲,無限重開
回到"User Generated Content/Fun"的思路本質,還是盡可能不依賴于開發者的内容更新。這也意味着妄圖把壓力轉嫁給玩家靠UGC編輯器代工并不靠譜,其不過多了些玩家原生的策劃,還得靠團隊披沙瀝金、得有足夠DAU的池子裏篩選。相對地,設計師提供積木、麻将這樣的玩具更具性價比——
可以誘導玩家激發反復練習、自我超越的欲望,例如《忍者必須死3》競技場的無盡跑道、《Neon White》同一地圖在極限操作下的最速通關;或者支持自由創造、提供驗證,例如《塞爾達傳説:王國之淚》裏結合究極手和左納烏的"我愛發明"系列,文能神廟解謎、武可欺負呀哈哈,争相競選弱智吧吧主;同理,還有自由選擇、真實反饋的樂趣,也正是開放世界的本質,而非玩完即棄的一次性大地圖。
一言以蔽之,AI原生遊戲≠無限生成内容的策劃機器人,≠搞個更簡易的編輯器讓玩家代工。
結合當下生成式AI的新能力,即推理、記憶、百科全書、自然語言互動、跨模态轉換,但體感上還有些喜歡"一本正經地胡説八道"的大忽悠,放在玩家敏感度高、容錯率低的場景大抵是吃力不讨好,但若能輔助設計師開發積木或麻将這樣的UGC玩具,即在扎實的設計框架裏,為玩家帶來額外的新體驗,未嘗不可一試。
先且不論算力要求和工程難度,後文将以「叙事開放世界」「沙盒與模拟經營」「湧現與電子鬥蛐蛐」「泛娛樂遊戲化」四點為切口,列舉部分相似思想的原型,并以「病毒式傳播和玩家共創」為收束,抛磚引玉。
叙事開放世界
開放世界的本質是賦予玩家足夠自由且有趣的體驗選擇,并給予真實的世界反饋,而非單純超大地圖、遍地走的NPC。借助LLM相對成熟的文本生成能力,也能有近似開放世界的體驗。
有趣的是,每當有新技術試圖來遊戲分一杯羹,總有媒體喜歡把《荒野大镖客II》等AAA開放世界作品挂在嘴邊,但若深究開放世界存在的合理性,絕非堆砌美術資產和任務罐頭,而是創造有趣且可信的世界,賦予玩家自由選擇的權利。對此,《塞爾達傳説:荒野之息》選擇了一套基于物理/化學引擎的實現手段,《殺手》《合金裝備V》則選擇了對同一任務目标提供多重解法。
這種将樂趣放權給玩家,能自由把玩的特性也對應了前文所述的UGC樂趣。聯想到大模型,借助其有邏輯推理、上下文記憶的文本生成能力,也能實現近似的AVG+開放體驗,但這不與美少女Galgame劃等号。畢竟比起"遊戲+叙事"的拼接,"遊戲×叙事"的機制融合更有趣,即要讓玩家"玩"故事,而非"看"演出,得參考諸如《史丹利的寓言》《奧伯拉丁的回歸》的設計。
将二者思想融合後,Inkle工作室的網狀叙事作品《Sorcery》《80 Days》《Overboard!》就值得參考,将情節分拆為狀态單元/Storylet的模塊化叙事結構與LLM有較大的聯動可行性。
譬如在《Overboard!》中,玩家需要扮演一位謀殺富豪老公來騙取高額保金的女士,而在這艘封閉的郵輪上,其餘5位NPC都或多或少有指證玩家謀殺的證據。沒錯,這次視角不再是偵探,流程也不局限于推理真相,而是想方設法地脱罪,有些像番劇《虛構推理》,全程靠一張嘴忽悠。
這款遊戲的開放性就體現在自由的脱罪思路,且心流可能截然不同,你可以選擇——
① 偽造證據,制造無頭懸案
② 嫁禍某位NPC,找尋其間漏洞
③ 拉攏其餘NPC,事成一起分贓
④ 幹脆把NPC都作做掉,物理意義解決問題
⑤ 先跳預言家,開局就給警察致電混淆視聽
⑥ 説不定還能找到皮劃艇鑰匙,提前開潤(腦洞)
......
而這都收斂于一艘固定場景的郵輪,互動也僅靠對話和簡單的道具,單局10~20min短平快的時長。麻雀雖小,五髒俱全,也正因其較高的自由度,配上合情合理的快速反饋,刺激不少玩家自願重開,試圖找到更完美的方案、或者更荒誕的解法。畢竟,偵探遊戲最有趣的不是那一個個解謎機關,而是最終把線索歸位復原真相,驚嘆"哦!原來如此,我早該想到的!"的那一刻。
回顧《Overboard!》這樣的一段小品級故事,研發周期也不過100天,看似門檻和成本都不高,但在傳統開發工具下,想做到這般"主觀感覺開放、實則收斂可控"的體驗,工夫盡在詩外,非常依賴編劇的人工推敲,梳理關鍵線索、NPC狀态。
Inkle叙事總監曾在GDC分享過另外款互動作品《Sorcery》的開發邏輯,采用少量狀态樹以達到足夠自由度
但在LLM的驅動下,可以把推理交給神經網絡,把選擇自由權轉到玩家,避免"策劃絞盡腦汁想了100種方案,玩家只玩了2~3種"。對于獨立團隊而言,或許更迭題材和體驗 (比如"末日/密室逃學生"、"偽裝間諜",不必拘泥于推理),就能搞點新樂子。也許還能兜售調用LLM的次數,限制玩家無限試錯、提供撤回操作的空間。
這種更契合Adventure本質的遊戲還有些許參考,例如具有随機生成元素的策略RPG《漫野奇譚》也有異曲同工之妙。或者跳出電子遊戲,曾經風靡歐美的Gamebook、無數童年回憶的《冒險小虎隊》,其思想也有十足的開放性。
提及叙事和開放性,不少從業者還會想到AI跑團。筆者認為,的确值得一做,但生成式AI并不直接解決跑團小眾的難題,當下依然是服務于核心群體,要想推廣跑團樂趣得在設計上做簡化。
畢竟跑團的本質,和"玩家自主創造樂趣/UGC"同理,是一種共同叙事。一段或荒誕、或温情的故事需要KP和PL共同完成——其中的随機Roll點只是實現手段,沒有玩家為此賦予的意義,大成功大失敗又能如何?
説到底,不同于更依賴劇本和DM帶飛的劇本殺,跑團是小夥伴們一起編故事的遊戲,得解放玩家的中二想象力,PL要不會玩,AI也幫不上忙。
制約跑團文化傳播的一大原因,并非簡單的組不齊車隊,而是新人不會玩、擔心玩不好的心理負擔——這也側面説明了,玩跑團和看跑團視頻終有隔閡,視頻的流行也難以直接把路人轉化為玩家,畢竟前者是親身參與、獨有體驗的調查員,後者是看客心态的觀眾。
照此邏輯,單純由Stable Diffusion驅動的立繪/CG生成、GPT系列驅動的KP/PL對老手倒是增添了些許體驗,但想讓更多潛在玩家體驗到跑團樂趣,得借助LLM在設計層面先循序漸進,提供充分的反饋。對此,售賣模組、按AI調用次數/時間的收費,也具備了一定的可行性。
題外話,一起編故事、樂子人等元素,搭載喜歡"胡説八道"的ChatGPT、再荒誕也能視覺化的Stable Diffusion,似乎《道詭異仙》還是個不錯的切口,人人皆是坐忘道,就主打一個個的虛虛實實、真真假假。
《道詭異仙》坐忘道似乎是不錯的選材參考,亦真亦假全靠玩家判斷,增加輸出的容錯率
沙盒與模拟經營
擁有記憶、計劃、反思能力的Generative Agents對NPC占比較重的扮演式模拟經營、控制類沙盒有較大幫助;同時,NPC不僅得鮮活,還需要設計師賦予其招募傭兵團/共同經營/戀愛後宮等意義,給予玩家自由把玩的目标。
作為RPG遊戲不可或缺的一環,非敵方NPC往往承擔了任務發布器和背景板的角色。盡管在多數遊戲裏,這些角色并不構成體驗的關鍵支柱,但依然要費不少心思來設計,且多為一次性消耗内容,還有可能不會被玩家觸發/認真對待。
不過,沿用"玩家自主創造樂趣"的思想,在生成式AI的技術加持下,更優的解法也許并非增加更多的NPC(當然也不會是僵硬地植入自由對話......),而是加強NPC、NPC之間的智能反饋,讓玩家有更強的主觀能動性,或組建一支神奇的傭兵團、或在復雜的國際環境執政(NPC也可能是一個個國家)、或挑戰廣開後宮(bushi)。
而這一切的實踐基礎,則是熱門的斯坦福大學論文《Generative Agents》,不由得對其中栩栩如生的角色關系嘆觀止矣。相較于曾經靠人工BT/FSM來框定角色行為,論文裏接入GPT3.5,裝載了能提取記憶、計劃、反思的Memory System,那NPC能據此先大致制定行為計劃、并針對環境和其餘NPC的變化做即時調整,來脱離純粹由策劃推理的困境。
如果説《Generative Agents》更像是個觀賞性的技術DEMO,想必不少從業者也想到了復雜性和可玩性都更強的沙盒遊戲。例如有異曲同工之妙的《矮人要塞》,控制七個性格各異的小矮人試圖建造一個堡壘,盡管遊戲ASCII古早的美術風格和極其硬核拟真的復雜難度(當然熱衷于此的朋友會説"Losing is fun") 勸退了不少看客,但都不妨礙其"醉酒貓"的MEME梗聲名在外——
起因只是矮人在酒館打架會碰倒酒杯,但結果是待在酒館的貓醉了(要知道在設定裏,貓是不會喝酒的),經過一番查詢,原來是酒沫濺到了貓毛,而小貓喜歡舔自己的毛,這才導致了醉酒狀态。盡管這更像是個意料之外的BUG,但或有趣、或荒誕的BUG所引發的蝴蝶效應又總能令玩家莞爾一笑,而背後的思想與Generative Agents有不少相似之處。
同理,《環世界》《僵屍毀滅工程》也有相似的設計脈絡,如果能引入LLM,并用LangChain"魔改",甚至擴展到MMO,讓單機體驗延伸到網遊,在奇幻的背景設定下組建兵團,玩家自然而然就有更廣闊的目标。
如果説以《矮人要塞》為代表的操控類沙盒作品上手門檻較高,那麼以《星露谷物語》《集合啦!動物森友會》為代表的扮演式模拟經營能吸引更多休閒玩家入坑,這也是Generative Agents可落地的場景。
相信不少玩家在《星露谷物語》中期都查過NPC出沒時間和地點的攻略,隔三差五地去聊天送禮,再等一個雨天去找老水手購買美人魚吊墜,最終與喜愛的角色結婚(不限性别),每天看着對象為你烹調早餐、澆灌田地,沒事兒還會來個擁抱。
如果用Generative Agents打造一個擁有長記憶體的NPC環境,也許這種小鎮反饋會更豐滿,而且内容可不局限于農閒生活和談情説愛,甚至不局限人類智慧體——畢竟NPC≠人,既能是沉藏海底、不可名狀的"魚群",也能是奇幻大陸的精靈海妖,滿足玩家的"細分需求"。
湧現與電子鬥蛐蛐
遊戲領網域的湧現是利用有限的規則組合,來構成豐富且有意義的反饋,但難就難在輸出結果依然是體驗可控。同樣有湧現特性的生成式AI,在融合遊戲性後,其本質是"電子鬥蛐蛐",滿足玩家作為上帝視角Kill Time的樂趣。
在GPT-3異軍突起,超越同期的BERT後,湧現一詞就常常被研究者提起。作為從復雜學科誕生的概念,湧現嘗試概括在宇宙、社會、生命等混沌中自發出現秩序的現象,例如天氣轉化、蟻群分工、免疫器官的構成背後都是由大量微觀個體在一定規則下的宏觀結果,其中最為知名的則是康威生命遊戲,直觀地演繹了數條規則下的豐富變種。
而這個源于自然的概念,經過些許簡化後,也在遊戲設計中得以體現——即利用有限的規則組合,來構成豐富且有意義的反饋,讓玩家自由探索樂趣所在。對此,最廣為人知的就是《塞爾達傳説:荒野之息》,只用希卡石板的四個新手村能力,加上符合直覺的物理(重力/温度)反饋,足以讓一團火有多種用途。
不過,湧現并非萬靈藥,復雜與有趣并非伴生關系。如今結合生成式AI來看,更重要的是可控湧現,即謹慎地設計基礎規則、推敲機制間的組合,使得結果仍在設計師預見範圍之内。的确,想優雅地完成絕非易事,但無需達到任天堂級别,只是汲取規則組合的思想,也能有不俗的創意。
譬如Sokpop工作室的《Simmiland》就是不錯的學習對象。其體驗像是上帝視角下的"電子鬥蛐蛐",玩家只需要在随機地圖裏決定打出「天氣」「礦石」「植物」「生物」的卡片,就可以左右小世界的環境,觀察小人NPC能搞出什麼新花樣。
千變萬化的卡片組合,可能帶領人類走向不同信仰的時代——也許是興建教堂的宗教路線、生產房屋汽車的工業路線、還可能是手搓火箭的科技路線,一切都取決于玩家意志和規則組合。
相似的,Sokpop的另一款佳作《Stacklands》則是基于抽卡包、卡牌間組合的邏輯,也能讓玩家自主創造一個世界,并伴随其文明的發展,其中貨币產出與抽卡消耗的循環使得該作更耐玩,且為商業化提供了空間。還有獨立遊戲開發者On的代表作《生命之島 GROW Island》,雖然是較為有限的排列組合,但精致的反饋也讓作品頗具可玩性。
設想,如果将上述遊戲的思想接入LLM,促使NPC學習對應規則,将卡片轉換為Prompt,也許經由同樣是湧現邏輯的神經網絡,能賦予玩家創造更加豐富、且符合直覺的小世界吧。其中,賣卡包/卡組、撤回/增加額外變量就有一定可行性,究竟本質還是賣prompt和調用次數。
回到"電子鬥蛐蛐"的設想,除了設定物理規則的互動,将湧現理解為個體與個體間互動所產生的社會現象也值得試試。這不禁讓人夢回2018年的《太污吾繪卷》,作為知名武俠開放世界RPG,茶餘飯後的談資卻并非戰鬥功法,而是"復雜且有些荒誕"的NPC關系、和鬥蛐蛐的副玩法。
有些反直覺的是,相較于過于強大的人工智能,有些荒誕的人工智障反倒讓玩家有種看樂子的掌控感。早期的武俠和修仙獨立遊戲均沒有復雜的AI,甚至還充斥着一堆BUG,表現上也只有單薄的文字,但縱觀Steam熱評、B站彈幕,不乏就着"剪不斷、理還亂"即興發揮的文豪,身處上帝視角的觀察和腦補讓玩家樂此不疲。
設想,如果NPC有更強的決策、記憶、推理能力,策劃只需設計頗具看點的矛盾、背景,也許就能滿足不少互聯網閒人Kill Time、圖一樂的需求。
泛娛樂遊戲化
為了脱離與傳統遊戲之間的價值對比,AI原生遊戲從包容度更高、敏感度較低的休閒玩家切入,可能會更快驗證其循環的合理性。而遊戲化改造的本質是賦予目标和反饋,支持玩家有趣的選擇,并在商業化設計上做好價值塑造。
如果説跑團、沙盒、開放世界、模拟經營都是面向遊戲玩家/Gamers,就不可避免會将生成式AI的作品與經典大作對比價值幾何——抛開概念噱頭,AI原生遊戲本質還是遊戲,内核要比肩《星露谷物語》本就不易。但如果放眼更休閒的非遊戲玩家/Non-Game Players,遊戲人的思維配合AI或許能有降維打擊的奇效,更容易在短期内驗證。
援引席德梅爾的名句"遊戲是一系列有趣的選擇",只需要增加目标和反饋,為對話增加風險博弈,原本平淡無奇的NPC聊天也能變得有趣,而這也是Character.AI等對話式產品有遊戲化改造空間的原因。
譬如獨立遊戲開發者大谷用GPT3.5開發了一個病嬌性格的AI貓娘女友,支持語音對話。但更重要的是作者設計了一個"密室逃脱"的目标(這很病嬌)。于是,玩家體驗不再是像Character.AI那樣的無目的閒聊,而是使出渾身解數,靠一張嘴盡快脱離"魔爪"。
這個DEMO也正是"玩家自主創造樂趣"的好例子。過去玩家能輸入什麼得靠設計師窮舉,本質還是一次性消耗品。如今,這份推理負擔轉交給了GPT系列,在具備一定邏輯性的同時甚至還有些花活兒。那玩家體驗的有趣與否相當看其創造力,設計師只需降低門檻、鼓勵玩家——當然也得防範NSFW的情況。
GPT,你也玩《原神》!
如果擔心調用LLM會有延遲問題,還可以在設定上選擇同樣有延遲反饋的設定來規避。例如曾席卷中文互聯網的《旅行青蛙》,佛系放置的背後,為這種不确定性的旅行提供了合理性,反而讓玩家期待"兒子"會帶來怎樣的照片。
再考慮到GPT系列尚且有些"一本正經的胡説八道",這種似是而非、模糊套話的輸出結果和具備巴納姆效應的部分心理測評、塔羅牌、解夢、算命有天然的契合度,文本和圖片的可解釋性本質在用户自己手上。
或許這也能用Midjourney輸出精致的塔羅牌卡面,經過針對性Fine-tuning的LLM對關鍵詞做解析,再由設計師對主題、UI/UX互動做些包裝,增加收集、裝扮、社交等目标和反饋,亦是一款不錯的泛娛樂遊戲化產品。
如果再将變現效率納入考量,海外《Chapters》《Episode》等可視化的視覺小説也和生成式AI有不錯的相性——相信關注出海的朋友經常能刷到上述產品非常"Drama"的投放素材,直擊北美16~45歲女性。
這種網文風作品的本質是情緒調動。其編輯深谙節奏疏密,平均1~3min就挑起衝突或高潮,哪怕角色和情節有些模板化,但架不住用户在Kill Time的時候還是吃這一套(相似的,抖音中AI有聲漫畫有異曲同工之妙)。
即便運營5+年之久,時間來到2022年,《Chapters》《Episode》依然在北美保持了2000~3000萬美元的年流水,巅峰時期月流水也曾破千萬美元。而不同于國内熟稔的Gacha模式,上述作品更擅長在調動好情緒後,在擦邊橋段提供【付費選項】和【免費選項】,而在故事轉折時戛然而止,提示得等待數小時或直接氪體力解鎖後續章節。
盡管這種逼氪的手段也消耗了玩家的耐心,但對普羅大眾而言,需求經久不衰。近年來包裝為模拟約會的MeChat也殺出重圍,站住了腳跟。且不難發現,新產品的xp也越發細分,而這種高度定制化、千人千面的需求正符合如NovelAI這樣的生成式AI,而靠人工編劇就很難盡善盡美。
與其用生成式AI出圖、配音、寫文去復刻這類作品,不如借鑑其情緒調動、并為選項賦予高價值的思想,售賣附加情節。畢竟商業化設計的本質是價值塑造與價格對比,AI原生遊戲若想持續發展,不建議只盯着天花板有限的IAA廣告變現,而是用遊戲設計的思想拔高其調動LLM/其他生成式AI工具的價值。
病毒式傳播與玩家共創
AI原生遊戲不應該以"技術"為壁壘,也不應該以"AI"作為賣點,而是思考AI以外真正觸動玩家的體驗是什麼?最好得利用病毒式傳播、玩家共創等方法,圍繞玩法/體驗構建專有的數據庫,以此形成壁壘。
盡管我們聊到了諸多與生成式AI相似思想的遊戲原型,但"玩家并不需要兩個《王者榮耀》",AI原生遊戲并非單純地再做一次相似作品,且核心賣點永遠是遊戲而非AI——AIGC+貪吃蛇,有趣之處仍然是貪吃蛇本體。當"AI遊戲"的概念即将被濫用時,AI以外的部分才是核心競争力,正如同鷹角、蠻啾、米哈遊也從未用"二次元"标榜自己。
同時,AI原生遊戲的成效也并不一定就屬于最早發布、最早擁有大量玩家關注的作品,而是要探讨如何圍繞體驗獲取更多玩家數據,以此迭代體驗、不斷循環,在細分體驗下構建競争壁壘。
這可類比于Midjouney,用户在Discord的每一次互動,既是獲得文生圖的反饋,也是為模型迭代提供數據,據此Midjourney能根據實際需求針對性地訓練模型以迭代體驗,形成數據飛輪。類似地,AI原生遊戲區别于傳統遊戲,也應當圍繞其設計,讓玩家的互動既是體驗的一部分,也同樣可轉化為迭代的養料。
為了吸引更多玩家,理解并結合好社區文化會是一大助力。考慮開發難度和傳播能力,紅極一時的小遊戲《人生重開模拟器》可能是不錯的試驗田,其Gacha式的互動推進和略顯荒誕的人生發展與AI有幾分相似,同時也具備病毒式傳播和二創的可能性——畢竟原版在第8天就已有10億次遊玩,并在此後衍生出魔法版、修仙版、爽文版等相似邏輯的作品。當這種思想接入生成式AI後,也許不只是純随機的對話,可以衍生出更多的玩法。
而跳出遊戲性本身,從壯大IP生命力的角度看,借力生成式AI的社區共創也非常值得探索——選擇能掩蓋生成式AI不易控制產出的短板,對"質量"要求不高,或者説本就接受浪漫主義、圖一樂的内容方向。
譬如《崩壞:星穹鐵道》在前段時間有場「無盡的三月七」圖生圖活動,模式簡單易懂。若按傳統影像生成的思想,想必是Prompt寫滿了諸如"Best Quality、Masterpiece、NSFW"等詞,出現奇怪的手、精致但沒靈魂屬于常态。
不過,對于二創而言,精美不是唯一出路,玩家自己玩得開心更重要,有時候整活兒才更具傳播力——在B站搜索關鍵詞,再按點擊量降序排列,似乎都是"怪東西"。但恰恰也是網友難以捉摸的想象力,将本不完美的圖轉化成QQ群裏的MEME,產生病毒式傳播。
從米哈遊這次活動説開去,發行側也可以将生成式AI打包為降低二創門檻的工具,并不一定是為了短期的整活兒,而是延續和擴展角色和遊戲故事,讓IP宇宙的内容更加健壯。例如,AI分鏡版、AI四格漫畫等,官方提供主題即可,其餘由粉絲放手開幹。
03
創作者
如果説上文是仰望星空,嘗試探讨AI原生遊戲會走向何方,那麼在這一篇章,我們得腳踏實地,回歸到這一切的根基——創作者。畢竟無論技術如何迭代,最稀缺的依然是一群懂遊戲、有審美、有開發能力的創作者,後文筆者希望探讨生成式AI如何作為Copliot輔助好開發與發行,讓人之價值回歸于人之本身。
降本:真正要減少的是溝通返工,倒逼上遊捋清需求
降低成本并非單純的裁員,而是設法降低溝通、返工、探索的摩擦損耗,捋清楚開發需求。
每當論及生成式AI對行業的影響,媒體和上市公司總喜歡把"降本增效"挂在嘴邊,但其中意藴相當朦胧,一直存在種刻板印象的誤解——仿佛"降本增效"等同于找到契機裁員,裁員後項目就能順利發展。
盡管研發費用的确在與日俱增,但做得不夠好玩,又如何靠省錢來獲利。如果真要論及人天節省的直接比例,比如PBR流程裏,早年的自動綁骨骼、自動展UV、生成LOD也不過是把原本0.5~1人天的工作量再縮短些,甚至還得人工復核破面、缺面等漏洞。
筆者認為,生成式AI對生產端的幫助更多是通過降低"溝通摩擦"和"探索試錯"的成本,倒逼從業者用奧卡姆剃刀原理想清楚設計意圖和核心體驗,從而提升效率,不是單純地優化人力。
作為一種復雜工程,提需求是開發者的一大要務,大模型也不可能直接服務于——"想個月流水過億的方案吧"。但相對地,ChatGPT、Stable Difussion等工具快速出稿的特性,在一定程度上能讓開發者厘清需求,圍繞項目的核心體驗和賣點,想好究竟要什麼、不要什麼。
畢竟,做加法是容易的,做減法是困難的,不少遊戲敗在缺乏主軸,產生冗餘設計和美術資產,沒有充分把資金花在服務于體驗的刀刃上。同時,策劃也可借助文生圖制作情緒版,更好地向美術同學傳遞需求,原畫也能用圖生圖反饋不同方案,與策劃快速達成共識,不必費功夫產出大量廢稿,尤其是涉及相對抽象的"温柔""帥氣""儀式感"等詞。同理,也可借助于Mubert、AIVA、Vits模型來試着生成音樂、配音小樣,在早期拿捏需求。
説到底,AI并不會替人想清楚,即便快速產出100張圖、100句話、100段BGM,也只會讓缺乏指導思想的開發者更加迷茫而難以取舍。某種意義上,學習AI,反倒是認清自己,是個"知道自己知道、知道自己不知道"的過程,積累知識、術語、閲讀量,以達到精準表達的目的。
增效:當基礎活兒靠Copilot節省後,人的核心能力将被放大
美術的工作重心是表達,而不是繪畫;UI的工作重心是互動,而不是圖示。AI Copilot時代促使創作者思考真正重要的是什麼。
凱文·凱利在接受采訪時曾提出個觀點——"人類 90% 的技能會被 AI 取代,剩下的 10% 會被放大。" 前半句的比例有多高并不重要,關鍵是充滿人本主義的後半句,即那些"人之所以為人"的事物是什麼。
以時下最火熱的2D原畫生成為例,回顧往昔,歷史的車輪總是有相似性。19世紀法國誕生了攝影,其靈感源自早年的繪畫輔助工具"暗箱" (小孔成像+畫家描摹),而作為世界首張"照片",《勒格哈的窗外景色》乍一看頗為粗糙,還需要長達至少8小時的曝光,直到10年後達蓋爾将技術發展到新裏程碑,這群繪畫出身的藝術家才摸到些門路,不過依然沒找到"攝影"的獨特性,還在沿襲嚴謹的靜物構圖等傳統美術在做的事兒。
所以,不出意外的,彼時"繪畫已死"的論調成為争議焦點。但有趣的是,也有不少畫家開始用照片當繪畫參考——畢竟請模特、布景費用比較昂貴,但短時間内又無法完成畫作。同時,剛出生的攝影還引發了"繪畫是為了什麼"的思潮,随即在往後的30年間催生了以莫奈、塞尚為首的印象派(彼時還是挖苦用的貶義詞),同時也誕生了有獨立體系、更加原生于照相機的攝影師。而二者的發展也總是互為靈感,繪畫受攝影的影響不再只是求真,攝影受繪畫的影響也融入了更多主觀性和浪漫主義色彩。
回到生成式AI在文生圖的發展來看,總有些歷史的暗合,同樣經歷了"耗時太長且出圖不能看,到相對快速且質量提升"、"引發繪畫是為了什麼的思潮"等階段。
關于這個問題,正好翻閲到穆夏的作品,頗有感觸,美術最重要的應是表達。當手繪轉為板繪、3D輔助建模深入一線,工具正不斷地被迭代,觸動人心的卻總是精湛技藝背後的情緒和思想,而臨摹從不會被看成美術工作者的代表作。
由此,筆者也觀察到部分遊戲的概念藝術家正積極用結合了ControlNet的Stable Diffusion來做探索,尤其是風格轉化、頭腦風暴、快速驗證。
例如近期上映的《蜘蛛俠:縱橫宇宙》就有獨特、大膽且多變的渲染視效。也許藝術家在看完後就忽而有某種表達欲,可以将其放入Stable Diffusion+Midjourney,試着轉換成截然不同的風格,先且不論精細度和正确性,只求快速產出氛圍和情緒參考——打開腦洞,更好更快地產出屬于自己的作品,而無需慢慢找參考、找到後還得親自試着畫畫。節省時間之餘,還可能帶來有趣的元素。
此刻,2D美術生成已是如火如荼,快速出100張圖不是難事,但對遊戲而言,有意義的内容才真正稀缺。畢竟對持續内容更新的項目而言,單個版本可能只推出1~2個角色。尤其是内容向作品,需要對每個角色的設定、戰鬥配置、對應的驗證環境都精心雕琢,才更好作為商品賣出,并非以量取勝。
因此,若想直接用上生成式AI的產出,似乎更适合在那些"不覺之間",例如投放素材、補間動畫、邊角背景、休閒小品。而在哪些部分投入,也正反向體現了遊戲的賣點,倒逼開發者将注意力放在表達和商業考量——
例如,擅長叙事的作品,講究情緒引導,真正缺的是懂關卡、懂燈光、懂3C調度等的遊戲導演,而不是堆砌文字;注重互動的作品,講究UI/UX的易用性、沉浸感、世界觀表達等,顯然不是Midjourney生成像模像樣的ICON那樣簡單粗暴......
無論如何,當生成式AI作為Copliot遲早替代基礎活兒後,反倒促進人的學習和思考,讓產出服務于價值本身。
04
近未來
每當新技術出現時,往往因其仍處在早期,會陷入一種"有點用但不多"的迷思,也容易有點"拿着錘子找釘子"的過度FOMO。不過事物發展總是螺旋演進的,需要理解好這把新錘子,不忽視也不鼓吹。筆者嘗試在該篇章分享些有趣的發展方向,聊點近未來。
盡管學界對以GPT-4為首的大模型究竟是"淺層統計模型"還是"習得内在規則"還存在較大的分歧,但不可否認的是,當前焦點依然是基于Transformer+Next Token Prediction的路徑,那如何打破Transformer不擅長處理長文本就是近期一大難題,畢竟普通GPT-4也只支持8000Token,會影響模型對字元間最長距離的支持和對上下文的計算壓力。
好消息是,Sam Altman近期在訪談提到會在2023年内開放最多支持100萬Token(約合75萬個單詞)的新GPT-4,并在2024年開放多模态GPT。類比于ControlNet不斷更新輸入條件,當輸入框大幅提升且支持非文本後,模型對材料的學習能力可能更上一層樓,也讓使用者的互動更靈活。
而當目光轉向影像生成領網域,礙于3D模型的信息密度高于2D影像/視頻、高質量數據少于語言模型、參數規模也不可比拟,暫未出現所謂的"湧現"現象。現階段最為矚目的Text-to-3D也多是"曲線救國",先生成低分辨率的2D影像或者3D粗模再進行優化,面數也非常低,突破口大概率還得看英偉達。
值得期待即将在8月召開的SIGGRAPH,英偉達預計會發布20篇生成式AI相關文章,包括但不限于"将文本轉為個性化影像的新型AI模型"、"可以将影像轉為3d模型的渲染工具"、"能夠模拟復雜3D元素的AI驅動神經物理模型",以及"生成實時視覺細節的神經渲染模型"。同期還有OpenAI的新模型Shape-E、以及基于Mesh生成的MeshDiffusion、國内無需3D數據直接文本生成帶紋理的Mesh模型或NeRF模型ProlificDreamer。
多數3D生成模型是基于模型庫訓練的,即無法生成非模型庫的内容,而MeshDiffusion可以基于Mesh生成訓練數據中不存在的全新形狀。不過面數還比較低,離工業還有點遠。
回歸當下,其實也有不少嘗試融入現有3D流程的工具,盡管可控性勢必與外包熟手相比欠了一層,不過依然有些小插件值得關注,例如專攻貼圖生成的BariumAI(已被Unity收購)、WithPoly,效果比單純Stable Diffusion生成的可能含後處理效果的貼圖靠譜,但諸如修改法線強度或者粗糙度還得人工來;再比如Blockade Labs近期推出的天空盒生成,輸入Prompt,可以得到360°旋轉、并且是無縫銜接的環境圖片。
現有圖形學的渲染方式受限于硬體已然成熟,但其流程也不乏僅僅服務于下遊的"中間品"。按PBR流程制作一個人形的3D角色,高模雕刻占比可能近50%的時間,而轉三視圖通常交給外包熟手搞定,展UV、删改LOD、蒙皮綁骨骼本就耗時不長,只是繁瑣枯燥。
若以更原生的思想來看,AI并非融入舊產線去跟高度熟練的外包搶活兒,而是嘗試構建一套新工作流(盡管如今還是存在想象中的科幻),不過目前的點雲、SDF、NeRF等路徑仍在實驗室階段,需要更長時間的探索。
至于代碼輔助、音樂生成、聲音轉換、無穿戴動捕等也有不錯的進展,可以預見,近期還會冒出不少AI Copilot型工具。不過,市場最稀缺的還是懂遊戲的產品經理,而非單純的工程師——畢竟對從業者而言,哪個好用、哪個好學就用哪個。參考遊戲引擎的歷史,好工具往往是一個好遊戲的附屬品,不然容易陷入"顱内自嗨"的窘境,若想搞ID Tech Engine就先搞個《DOOM》、搞Unreal就先搞個《虛幻競技場》,因此好工具得從遊戲團隊"長"出來,很難由硅谷工程師們憑空生造。
殊途同歸,AI原生Feature的探索最終都會回到遊戲開發本身,新生的火炬之光依然得由開發者舉起。而在路徑混沌、資源分配不均的當下,大廠和創業團隊尚未進入競争階段,二者都面臨各自的難題——譬如大廠得思考ROI悖論,費力煉制的模型是否對應充足的真需求,中台的研究離一線業務是否又太遠,懂AI又懂遊戲的CTO此刻身在何方...... 那麼,誰能掙脱桎梏,先行走出新路徑,誰就能獲得超額收益。四王抬棺,榮譽總是屬于開拓者。
05
尾聲,但并非結局
生成式AI的一切思考都不應盲目擁抱或排斥,唯有了解新技術的來龍去脈與本質,以發展和開放的心态去探索,回到最務實的生產流程和遊戲樂趣後,才能更好地與時代共振。
最後,援引曾供職于OpenAI的兩位科學家Kenneth Stanley和Joel Lehman在《為什麼偉大不能被計劃》一書所寫的話作為結尾——
偉大不是目标指引的結果,因為通往偉大的路線從來都不是直線,很多時候快反而就是慢。萊特兄弟發明飛機,最早用的是自行車技術;本來是用于驅動雷達磁控管的一個部件,意外成就了微波爐;第一台電子計算機用的是電子管,但電子管根本就不是為了計算機而發明的;YouTube最初的設想是一個視頻約會網站,後來發現人們喜歡在上面分享五花八門的視頻;比爾·蓋茨迎合極客打遊戲的需求,結果普及了個人電腦;埃隆·馬斯克起家是網上支付,最後卻推出了SpaceX和特斯拉……
也許,此刻,在世界的某個角落裏,一群夠Nerd的天才正發明令人嘆服的新"玩具"。
*文中所有圖片版權歸原作者所有,僅供分享交流不作商業用途,侵删
遊戲葡萄招聘内容編輯,