“别再尬吹AI能降本增效了”

今天小編分享的遊戲經驗：“别再尬吹AI能降本增效了”，歡迎閲讀。

The following article is from GT遊戲人互助 Author 成志@GameTrigger

前言

降本增效：AI會取代原畫嗎？美術已節省xx人天

xx遊戲：懷疑使用AI，玩家聲讨、廠商道歉

xx公司官宣推出大模型，融資xx萬美金

萬字長文解析：英偉達又搓出什麼新核彈

......

在過去的200多天，也許你已然對這些标題麻木無感、甚至有些PTSD，但依然會有種不真切的迷離感——怎麼AI又火了，這是下一個元宇宙/Web3嗎？遊戲難道因此更好做、更好玩了嗎？

抱着如上疑惑，作為專注遊戲行業的投資人，秉持着好奇與求真的态度，筆者走訪了海内外遊戲開發者、AI研究員、AI創業公司，一路能聽到關于"AI遊戲"至少10種不同的定義（堪比20~21年人均"二次元"的盛況）。為了促進跨界交流，共同探索"AI遊戲"究竟是什麼，也曾在22年12月舉辦過AIGC主題的Game Jam。

結合研究與實踐，希望在這個信息過載的時刻，能為行業分享些接地氣兒的觀察、提供更AI原生的遊戲思考和腦洞，少一些無謂的FOMO——畢竟，無論技術如何迭代，遊戲好玩才是硬道理，審美好、懂設計、懂開發的遊戲人總是稀缺的。

舊話題裏的新鮮事

開源生态、二次元同人文化、開發者與創作者共創，促成生成式AI在創作圈的繁榮。遊戲，作為視聽互動的集大成者、也是變現效率極高的產品形态，同時有相對更温和的包容度，其土壤天然适合生成式AI的探索。

以影像生成為例，時間撥轉回2022年8月，Stable Diffusion方才問世，開源之火就迅速點燃了創作者的好奇心。在随後的10月，NovelAI推出基于Stable Diffusion和530萬張Danbooru影像訓練的文生圖模型，數日内蹿紅，但很快被意外破解。

彼時，互聯網大江南北都流轉着Vtuber區UP主秋葉aaaki的本地部署教程，同期《元素法典(1)(1)(2).pdf》也傳遍了大大小小的社群。或許最初這都不過是圖一樂，但在一票ACG相關創作者的努力下，文生圖/圖生圖又更上一層樓——曾開發出Waifu生成器的Spellbrush聯合Midjourney推出專注美少女的Niji Journey，年輕牌佬、YGOPro2作者鼓搗出ControlNet。

有趣的是，這輪生成式AI的主要傳火者并不在曾經設想的工業界、機器人，而是創作領網域，尤其在二次元同人圈。畢竟，相較于管線更成熟、容錯率低的工業需求，同人創作擁有相對更好的包容度、也有更濃的幻想和創作欲。

于是，擅長整活兒、常年混迹社區的愛好者紛紛轉型煉丹師，眼下B站首頁不乏"AI角色唱歌"、"AI小草神舞蹈"；在HuggingFace的開源生态裏，也有不少老二次元工程師貢獻項目模型。

萬眾矚目的Character.AI，ACG類角色的調用量遠超其餘類型——畢竟能跟屑狐狸聊天，能獲得5t5陪伴，為什麼不放飛下自我呢？這波，二次元上大分，社區文化大勝利

而在所有的文娛創作中，遊戲，無疑是視聽互動的集大成者、也聚集相當多創作和技術人才，且F2P網遊的商業模式又早已被确立，因此被眾多從業者關注，各界多有"遊戲是AIGC落地的第一站"的觀點。

不過，在生成式AI浪潮來臨前，遊戲+AI本身也算不得什麼新鮮事。從NPC/怪物決策講，最普遍的無非行為樹、有限狀态機，也有較難設計、不甚常用的GOAP；生產流程上，不乏AI減面、自動展UV、網文生成器等工具；回到傳統的強化學習，雖限于少數重度PvP、三消等場景，但也較為成熟；即便跳出AI，諸如Houndini+SD等程式化生成工具，使用率即便較低，但也有點年頭。那如今燥熱的「生成式AI」究竟有什麼新活兒？

回歸「生成式AI」的發展，已有相當多科普梳理，在此不再贅述。一言以蔽之，自此不需要再為特定任務做專項訓練、也無需像傳統NLP得先拆分子任務。通才大模型在少量Prompt指令下，能結合上下文學習，可勝任相當多生成性工作，而不只是曾經簡單的翻譯理解（AutoGPT甚至可以幫你寫Prompt，長期來看，Prompt也可能只是指令互動的過渡媒介）。

同時，在有點兒「暴力美學」的縮放法則（Scaling Law）加持下，高質量數據和大量參數可以湧現出推理能力，如果加入其他模态的數據，還能相互轉換，甚至上半年的GPT-4、微軟KOSMOS-1還能讀懂梗圖。

就着"生成"和"推理"兩大關鍵能力，也衍生出了「降本增效」的AIGC工具派和「原生體驗」的AIGC遊戲派。

對于「降本增效」而言，抛開上市公司喊話大模型的市值管理行為，工具确實有一定效果，但當前仍無法滿足對可控性和容錯率的高要求。而對比以往"渠道迭代、產品質量為王、小團隊自研自發成為可能"等行業價值鏈的結構性變化，目前的生成式AI尚且還沒有清晰的"颠覆"路徑。

此外，遊戲趣味和盈利能力也并不與投入資本的多寡呈線性的正相關——巨制會翻車、小品也能爆。如果不談如何創造新體驗，只聚焦工具提效，可能不免就會陷入"不過是将14人天的立繪設計縮短到10人天，将0.5人天的綁骨骼縮短到0.2人天，但還是不符合賣點、玩家覺得不如《O神》"的窘境。

因此，在混沌之初，更值得探讨的還是"AI原生遊戲會長什麼樣"，能否為玩家帶來新樂子，或者提供新的變現模式——畢竟，遊戲體驗永遠是内核，作品不夠好玩，玩家不願買賬，聊再多"降本增效"也無濟于事。

原生體驗

AI原生遊戲，有兩種截然不同的路徑——第一種是純粹的遊戲思維，即選擇有相似思想的原型，先做個好玩的遊戲，将AI視作錦上添花和樂趣延伸；第二種則是遊戲化的互聯網產品思維，即用"遊戲化"包裝泛娛樂需求，追求傳播和增長裂變，AI扮演提供樂子的工具。

聊起遊戲本身，也有人聽到AI創新後眼前一亮，仿佛無限關卡近在眼前，再搞個UGC編輯器，豈不就是遊戲永動機——赢麻了。

但很遺憾，後文将説明AI原生遊戲并不等同于無限生成内容的策劃機器人，更不是搞個更簡易的編輯器讓玩家代工。在這裏，筆者先提出一種思想——AI原生遊戲将發生從"設計師創造樂趣"到"玩家自主創造樂趣"的範式轉換，即廣義上的UGC，AI原生遊戲的趣味得由開發者、AI、玩家三者共創。

談及遊戲創新的範式，筆者粗略地先分出三種路徑：①想到但做不到——通常卡在設計/技術；②做到但不夠好——最為常見的微創新；③壓根沒想到——神來一筆/有時是品類級機會。

其中，第一點和第二點尚有讨論空間，即生成式AI的推理特性能否優化已有體驗，拓寬其樂趣。但聊到第三點，就很難僅拿着概念來做無中生有的空想，即能以xxx-like命名的創新往往和機制、互動相關，得經歷長時間推敲和驗證才能成型，與技術更迭并無直接幹系。故全新體驗的确有可能出現，但暫不在本文讨論範疇中。

回到第二點"做到但不夠好"，歷來是業内最務實的話題，但要跨越這難關，對多數網遊而言，最棘手的還不是去想那些凸顯差異化的小設計，而是處理"内容產出速率低于玩家消耗速率"的窘境。只不過在普遍如此的當下，玩家和研發就"長草"和"坐牢"達成了一種微妙的相互妥協——但個中原因僅僅是内容少嗎？仔細一想也不對。

為了能繼續推進劇情/畢業喜歡的強力角色，即便痛罵一頓，還得回去反復刷材料

對于側重局内體驗的遊戲，刺激長留和付費的往往是精雕細琢的高星角色、BOSS戰、主線演出、一波三折的關卡，肯定不是量大管飽的填充物（此處點名看似無限的Roguelike副本、看似随機的日常任務）。哪怕儲備了一系列高質量内容，也得講究"物以稀為貴"，釋放節奏要論疏密，不會一味地高強度更新——總不能每周一個新卡池等着被罵吧。

對于側重局外養成的遊戲，關卡/戰鬥又更多是驗證養成的一道場景，爆出神兵、刷齊套裝、湊足Build的數值反饋更重要，其留存内核顯然也不是從多堆幾關小怪能解決的。

因此，内容過速消耗的關鍵似乎并不在多寡。我們常常談及的工業化產線也并不意指量大管飽，只是盡可能保質、保量、保時地產出版本，滿足玩家對長期驅動力的追求。

從這個視角來看，AIGC能無限生成内容的幻想，除了強化學習在極少數MOBA/FPS的AI Bot、純關卡驅動的三消、需要陪玩的菠菜有價值外，其餘品類就總缺了點立足之處，還會陷入"算法人才難覓、數據集有限、訓練成本高昂，不如招個資深策劃"的ROI悖論。

筆者認為，更好的思路，可能是從"設計師創造樂趣"到"玩家自主創造樂趣"的範式轉換——即廣義而言的UGC，這其實與生成式AI天然契合。不過這裏的UGC≠搞編輯器，不是去硬抄《蛋仔派對》《Roblox》，其實質是開發者設計好互動方式、規則機制和反饋邏輯，而将具體樂趣的創造放權給玩家。

最典型的例子就是麻将和樂高的思想。

麻将，也可代指一切優質的PvP遊戲，在基礎規則既定後，借助随機性和風險博弈，雀友的發揮決定了樂趣多寡。只要還能肝，赢家和輸家都想無限地再開一把，且還自帶傳播性。

樂高，也可代指一切有沙盒創造屬性的遊戲，本質是以物理規則為支撐，定義了基礎元件的連接方式，而無論是創造還是破壞都有其樂趣。同時，設計重點不在于玩具制造本身，而是如何提供合理的反饋，畢竟空有屠龍刀而無龍可屠就多少欠了點意思。不過一旦成型，千人千面，玩家總會找到獨屬自己的樂趣所在。

麻将：頂級UGC遊戲，樂此不疲，無限重開

回到"User Generated Content/Fun"的思路本質，還是盡可能不依賴于開發者的内容更新。這也意味着妄圖把壓力轉嫁給玩家靠UGC編輯器代工并不靠譜，其不過多了些玩家原生的策劃，還得靠團隊披沙瀝金、得有足夠DAU的池子裏篩選。相對地，設計師提供積木、麻将這樣的玩具更具性價比——

可以誘導玩家激發反復練習、自我超越的欲望，例如《忍者必須死3》競技場的無盡跑道、《Neon White》同一地圖在極限操作下的最速通關；或者支持自由創造、提供驗證，例如《塞爾達傳説：王國之淚》裏結合究極手和左納烏的"我愛發明"系列，文能神廟解謎、武可欺負呀哈哈，争相競選弱智吧吧主；同理，還有自由選擇、真實反饋的樂趣，也正是開放世界的本質，而非玩完即棄的一次性大地圖。

一言以蔽之，AI原生遊戲≠無限生成内容的策劃機器人，≠搞個更簡易的編輯器讓玩家代工。

結合當下生成式AI的新能力，即推理、記憶、百科全書、自然語言互動、跨模态轉換，但體感上還有些喜歡"一本正經地胡説八道"的大忽悠，放在玩家敏感度高、容錯率低的場景大抵是吃力不讨好，但若能輔助設計師開發積木或麻将這樣的UGC玩具，即在扎實的設計框架裏，為玩家帶來額外的新體驗，未嘗不可一試。

先且不論算力要求和工程難度，後文将以「叙事開放世界」「沙盒與模拟經營」「湧現與電子鬥蛐蛐」「泛娛樂遊戲化」四點為切口，列舉部分相似思想的原型，并以「病毒式傳播和玩家共創」為收束，抛磚引玉。

叙事開放世界

開放世界的本質是賦予玩家足夠自由且有趣的體驗選擇，并給予真實的世界反饋，而非單純超大地圖、遍地走的NPC。借助LLM相對成熟的文本生成能力，也能有近似開放世界的體驗。

有趣的是，每當有新技術試圖來遊戲分一杯羹，總有媒體喜歡把《荒野大镖客II》等AAA開放世界作品挂在嘴邊，但若深究開放世界存在的合理性，絕非堆砌美術資產和任務罐頭，而是創造有趣且可信的世界，賦予玩家自由選擇的權利。對此，《塞爾達傳説：荒野之息》選擇了一套基于物理/化學引擎的實現手段，《殺手》《合金裝備V》則選擇了對同一任務目标提供多重解法。

這種将樂趣放權給玩家，能自由把玩的特性也對應了前文所述的UGC樂趣。聯想到大模型，借助其有邏輯推理、上下文記憶的文本生成能力，也能實現近似的AVG+開放體驗，但這不與美少女Galgame劃等号。畢竟比起"遊戲+叙事"的拼接，"遊戲×叙事"的機制融合更有趣，即要讓玩家"玩"故事，而非"看"演出，得參考諸如《史丹利的寓言》《奧伯拉丁的回歸》的設計。

将二者思想融合後，Inkle工作室的網狀叙事作品《Sorcery》《80 Days》《Overboard!》就值得參考，将情節分拆為狀态單元/Storylet的模塊化叙事結構與LLM有較大的聯動可行性。

譬如在《Overboard!》中，玩家需要扮演一位謀殺富豪老公來騙取高額保金的女士，而在這艘封閉的郵輪上，其餘5位NPC都或多或少有指證玩家謀殺的證據。沒錯，這次視角不再是偵探，流程也不局限于推理真相，而是想方設法地脱罪，有些像番劇《虛構推理》，全程靠一張嘴忽悠。

這款遊戲的開放性就體現在自由的脱罪思路，且心流可能截然不同，你可以選擇——

① 偽造證據，制造無頭懸案

② 嫁禍某位NPC，找尋其間漏洞

③ 拉攏其餘NPC，事成一起分贓

④ 幹脆把NPC都作做掉，物理意義解決問題

⑤ 先跳預言家，開局就給警察致電混淆視聽

⑥ 説不定還能找到皮劃艇鑰匙，提前開潤（腦洞）

......

而這都收斂于一艘固定場景的郵輪，互動也僅靠對話和簡單的道具，單局10~20min短平快的時長。麻雀雖小，五髒俱全，也正因其較高的自由度，配上合情合理的快速反饋，刺激不少玩家自願重開，試圖找到更完美的方案、或者更荒誕的解法。畢竟，偵探遊戲最有趣的不是那一個個解謎機關，而是最終把線索歸位復原真相，驚嘆"哦！原來如此，我早該想到的！"的那一刻。

回顧《Overboard!》這樣的一段小品級故事，研發周期也不過100天，看似門檻和成本都不高，但在傳統開發工具下，想做到這般"主觀感覺開放、實則收斂可控"的體驗，工夫盡在詩外，非常依賴編劇的人工推敲，梳理關鍵線索、NPC狀态。

Inkle叙事總監曾在GDC分享過另外款互動作品《Sorcery》的開發邏輯，采用少量狀态樹以達到足夠自由度

但在LLM的驅動下，可以把推理交給神經網絡，把選擇自由權轉到玩家，避免"策劃絞盡腦汁想了100種方案，玩家只玩了2~3種"。對于獨立團隊而言，或許更迭題材和體驗（比如"末日/密室逃學生"、"偽裝間諜"，不必拘泥于推理），就能搞點新樂子。也許還能兜售調用LLM的次數，限制玩家無限試錯、提供撤回操作的空間。

這種更契合Adventure本質的遊戲還有些許參考，例如具有随機生成元素的策略RPG《漫野奇譚》也有異曲同工之妙。或者跳出電子遊戲，曾經風靡歐美的Gamebook、無數童年回憶的《冒險小虎隊》，其思想也有十足的開放性。

提及叙事和開放性，不少從業者還會想到AI跑團。筆者認為，的确值得一做，但生成式AI并不直接解決跑團小眾的難題，當下依然是服務于核心群體，要想推廣跑團樂趣得在設計上做簡化。

畢竟跑團的本質，和"玩家自主創造樂趣/UGC"同理，是一種共同叙事。一段或荒誕、或温情的故事需要KP和PL共同完成——其中的随機Roll點只是實現手段，沒有玩家為此賦予的意義，大成功大失敗又能如何？

説到底，不同于更依賴劇本和DM帶飛的劇本殺，跑團是小夥伴們一起編故事的遊戲，得解放玩家的中二想象力，PL要不會玩，AI也幫不上忙。

制約跑團文化傳播的一大原因，并非簡單的組不齊車隊，而是新人不會玩、擔心玩不好的心理負擔——這也側面説明了，玩跑團和看跑團視頻終有隔閡，視頻的流行也難以直接把路人轉化為玩家，畢竟前者是親身參與、獨有體驗的調查員，後者是看客心态的觀眾。

照此邏輯，單純由Stable Diffusion驅動的立繪/CG生成、GPT系列驅動的KP/PL對老手倒是增添了些許體驗，但想讓更多潛在玩家體驗到跑團樂趣，得借助LLM在設計層面先循序漸進，提供充分的反饋。對此，售賣模組、按AI調用次數/時間的收費，也具備了一定的可行性。

題外話，一起編故事、樂子人等元素，搭載喜歡"胡説八道"的ChatGPT、再荒誕也能視覺化的Stable Diffusion，似乎《道詭異仙》還是個不錯的切口，人人皆是坐忘道，就主打一個個的虛虛實實、真真假假。

《道詭異仙》坐忘道似乎是不錯的選材參考，亦真亦假全靠玩家判斷，增加輸出的容錯率

沙盒與模拟經營

擁有記憶、計劃、反思能力的Generative Agents對NPC占比較重的扮演式模拟經營、控制類沙盒有較大幫助；同時，NPC不僅得鮮活，還需要設計師賦予其招募傭兵團/共同經營/戀愛後宮等意義，給予玩家自由把玩的目标。

作為RPG遊戲不可或缺的一環，非敵方NPC往往承擔了任務發布器和背景板的角色。盡管在多數遊戲裏，這些角色并不構成體驗的關鍵支柱，但依然要費不少心思來設計，且多為一次性消耗内容，還有可能不會被玩家觸發/認真對待。

不過，沿用"玩家自主創造樂趣"的思想，在生成式AI的技術加持下，更優的解法也許并非增加更多的NPC（當然也不會是僵硬地植入自由對話......），而是加強NPC、NPC之間的智能反饋，讓玩家有更強的主觀能動性，或組建一支神奇的傭兵團、或在復雜的國際環境執政（NPC也可能是一個個國家）、或挑戰廣開後宮（bushi）。

而這一切的實踐基礎，則是熱門的斯坦福大學論文《Generative Agents》，不由得對其中栩栩如生的角色關系嘆觀止矣。相較于曾經靠人工BT/FSM來框定角色行為，論文裏接入GPT3.5，裝載了能提取記憶、計劃、反思的Memory System，那NPC能據此先大致制定行為計劃、并針對環境和其餘NPC的變化做即時調整，來脱離純粹由策劃推理的困境。

如果説《Generative Agents》更像是個觀賞性的技術DEMO，想必不少從業者也想到了復雜性和可玩性都更強的沙盒遊戲。例如有異曲同工之妙的《矮人要塞》，控制七個性格各異的小矮人試圖建造一個堡壘，盡管遊戲ASCII古早的美術風格和極其硬核拟真的復雜難度（當然熱衷于此的朋友會説"Losing is fun"）勸退了不少看客，但都不妨礙其"醉酒貓"的MEME梗聲名在外——

起因只是矮人在酒館打架會碰倒酒杯，但結果是待在酒館的貓醉了（要知道在設定裏，貓是不會喝酒的），經過一番查詢，原來是酒沫濺到了貓毛，而小貓喜歡舔自己的毛，這才導致了醉酒狀态。盡管這更像是個意料之外的BUG，但或有趣、或荒誕的BUG所引發的蝴蝶效應又總能令玩家莞爾一笑，而背後的思想與Generative Agents有不少相似之處。

同理，《環世界》《僵屍毀滅工程》也有相似的設計脈絡，如果能引入LLM，并用LangChain"魔改"，甚至擴展到MMO，讓單機體驗延伸到網遊，在奇幻的背景設定下組建兵團，玩家自然而然就有更廣闊的目标。

如果説以《矮人要塞》為代表的操控類沙盒作品上手門檻較高，那麼以《星露谷物語》《集合啦！動物森友會》為代表的扮演式模拟經營能吸引更多休閒玩家入坑，這也是Generative Agents可落地的場景。

相信不少玩家在《星露谷物語》中期都查過NPC出沒時間和地點的攻略，隔三差五地去聊天送禮，再等一個雨天去找老水手購買美人魚吊墜，最終與喜愛的角色結婚（不限性别），每天看着對象為你烹調早餐、澆灌田地，沒事兒還會來個擁抱。

如果用Generative Agents打造一個擁有長記憶體的NPC環境，也許這種小鎮反饋會更豐滿，而且内容可不局限于農閒生活和談情説愛，甚至不局限人類智慧體——畢竟NPC≠人，既能是沉藏海底、不可名狀的"魚群"，也能是奇幻大陸的精靈海妖，滿足玩家的"細分需求"。

湧現與電子鬥蛐蛐

遊戲領網域的湧現是利用有限的規則組合，來構成豐富且有意義的反饋，但難就難在輸出結果依然是體驗可控。同樣有湧現特性的生成式AI，在融合遊戲性後，其本質是"電子鬥蛐蛐"，滿足玩家作為上帝視角Kill Time的樂趣。

在GPT-3異軍突起，超越同期的BERT後，湧現一詞就常常被研究者提起。作為從復雜學科誕生的概念，湧現嘗試概括在宇宙、社會、生命等混沌中自發出現秩序的現象，例如天氣轉化、蟻群分工、免疫器官的構成背後都是由大量微觀個體在一定規則下的宏觀結果，其中最為知名的則是康威生命遊戲，直觀地演繹了數條規則下的豐富變種。

而這個源于自然的概念，經過些許簡化後，也在遊戲設計中得以體現——即利用有限的規則組合，來構成豐富且有意義的反饋，讓玩家自由探索樂趣所在。對此，最廣為人知的就是《塞爾達傳説：荒野之息》，只用希卡石板的四個新手村能力，加上符合直覺的物理（重力/温度）反饋，足以讓一團火有多種用途。

不過，湧現并非萬靈藥，復雜與有趣并非伴生關系。如今結合生成式AI來看，更重要的是可控湧現，即謹慎地設計基礎規則、推敲機制間的組合，使得結果仍在設計師預見範圍之内。的确，想優雅地完成絕非易事，但無需達到任天堂級别，只是汲取規則組合的思想，也能有不俗的創意。

譬如Sokpop工作室的《Simmiland》就是不錯的學習對象。其體驗像是上帝視角下的"電子鬥蛐蛐"，玩家只需要在随機地圖裏決定打出「天氣」「礦石」「植物」「生物」的卡片，就可以左右小世界的環境，觀察小人NPC能搞出什麼新花樣。

千變萬化的卡片組合，可能帶領人類走向不同信仰的時代——也許是興建教堂的宗教路線、生產房屋汽車的工業路線、還可能是手搓火箭的科技路線，一切都取決于玩家意志和規則組合。

相似的，Sokpop的另一款佳作《Stacklands》則是基于抽卡包、卡牌間組合的邏輯，也能讓玩家自主創造一個世界，并伴随其文明的發展，其中貨币產出與抽卡消耗的循環使得該作更耐玩，且為商業化提供了空間。還有獨立遊戲開發者On的代表作《生命之島 GROW Island》，雖然是較為有限的排列組合，但精致的反饋也讓作品頗具可玩性。

設想，如果将上述遊戲的思想接入LLM，促使NPC學習對應規則，将卡片轉換為Prompt，也許經由同樣是湧現邏輯的神經網絡，能賦予玩家創造更加豐富、且符合直覺的小世界吧。其中，賣卡包/卡組、撤回/增加額外變量就有一定可行性，究竟本質還是賣prompt和調用次數。

回到"電子鬥蛐蛐"的設想，除了設定物理規則的互動，将湧現理解為個體與個體間互動所產生的社會現象也值得試試。這不禁讓人夢回2018年的《太污吾繪卷》，作為知名武俠開放世界RPG，茶餘飯後的談資卻并非戰鬥功法，而是"復雜且有些荒誕"的NPC關系、和鬥蛐蛐的副玩法。

有些反直覺的是，相較于過于強大的人工智能，有些荒誕的人工智障反倒讓玩家有種看樂子的掌控感。早期的武俠和修仙獨立遊戲均沒有復雜的AI，甚至還充斥着一堆BUG，表現上也只有單薄的文字，但縱觀Steam熱評、B站彈幕，不乏就着"剪不斷、理還亂"即興發揮的文豪，身處上帝視角的觀察和腦補讓玩家樂此不疲。

設想，如果NPC有更強的決策、記憶、推理能力，策劃只需設計頗具看點的矛盾、背景，也許就能滿足不少互聯網閒人Kill Time、圖一樂的需求。

泛娛樂遊戲化

為了脱離與傳統遊戲之間的價值對比，AI原生遊戲從包容度更高、敏感度較低的休閒玩家切入，可能會更快驗證其循環的合理性。而遊戲化改造的本質是賦予目标和反饋，支持玩家有趣的選擇，并在商業化設計上做好價值塑造。

如果説跑團、沙盒、開放世界、模拟經營都是面向遊戲玩家/Gamers，就不可避免會将生成式AI的作品與經典大作對比價值幾何——抛開概念噱頭，AI原生遊戲本質還是遊戲，内核要比肩《星露谷物語》本就不易。但如果放眼更休閒的非遊戲玩家/Non-Game Players，遊戲人的思維配合AI或許能有降維打擊的奇效，更容易在短期内驗證。

援引席德梅爾的名句"遊戲是一系列有趣的選擇"，只需要增加目标和反饋，為對話增加風險博弈，原本平淡無奇的NPC聊天也能變得有趣，而這也是Character.AI等對話式產品有遊戲化改造空間的原因。

譬如獨立遊戲開發者大谷用GPT3.5開發了一個病嬌性格的AI貓娘女友，支持語音對話。但更重要的是作者設計了一個"密室逃脱"的目标（這很病嬌）。于是，玩家體驗不再是像Character.AI那樣的無目的閒聊，而是使出渾身解數，靠一張嘴盡快脱離"魔爪"。

這個DEMO也正是"玩家自主創造樂趣"的好例子。過去玩家能輸入什麼得靠設計師窮舉，本質還是一次性消耗品。如今，這份推理負擔轉交給了GPT系列，在具備一定邏輯性的同時甚至還有些花活兒。那玩家體驗的有趣與否相當看其創造力，設計師只需降低門檻、鼓勵玩家——當然也得防範NSFW的情況。

GPT，你也玩《原神》！

如果擔心調用LLM會有延遲問題，還可以在設定上選擇同樣有延遲反饋的設定來規避。例如曾席卷中文互聯網的《旅行青蛙》，佛系放置的背後，為這種不确定性的旅行提供了合理性，反而讓玩家期待"兒子"會帶來怎樣的照片。

再考慮到GPT系列尚且有些"一本正經的胡説八道"，這種似是而非、模糊套話的輸出結果和具備巴納姆效應的部分心理測評、塔羅牌、解夢、算命有天然的契合度，文本和圖片的可解釋性本質在用户自己手上。

或許這也能用Midjourney輸出精致的塔羅牌卡面，經過針對性Fine-tuning的LLM對關鍵詞做解析，再由設計師對主題、UI/UX互動做些包裝，增加收集、裝扮、社交等目标和反饋，亦是一款不錯的泛娛樂遊戲化產品。

如果再将變現效率納入考量，海外《Chapters》《Episode》等可視化的視覺小説也和生成式AI有不錯的相性——相信關注出海的朋友經常能刷到上述產品非常"Drama"的投放素材，直擊北美16~45歲女性。

這種網文風作品的本質是情緒調動。其編輯深谙節奏疏密，平均1~3min就挑起衝突或高潮，哪怕角色和情節有些模板化，但架不住用户在Kill Time的時候還是吃這一套（相似的，抖音中AI有聲漫畫有異曲同工之妙）。

即便運營5+年之久，時間來到2022年，《Chapters》《Episode》依然在北美保持了2000~3000萬美元的年流水，巅峰時期月流水也曾破千萬美元。而不同于國内熟稔的Gacha模式，上述作品更擅長在調動好情緒後，在擦邊橋段提供【付費選項】和【免費選項】，而在故事轉折時戛然而止，提示得等待數小時或直接氪體力解鎖後續章節。

盡管這種逼氪的手段也消耗了玩家的耐心，但對普羅大眾而言，需求經久不衰。近年來包裝為模拟約會的MeChat也殺出重圍，站住了腳跟。且不難發現，新產品的xp也越發細分，而這種高度定制化、千人千面的需求正符合如NovelAI這樣的生成式AI，而靠人工編劇就很難盡善盡美。

與其用生成式AI出圖、配音、寫文去復刻這類作品，不如借鑑其情緒調動、并為選項賦予高價值的思想，售賣附加情節。畢竟商業化設計的本質是價值塑造與價格對比，AI原生遊戲若想持續發展，不建議只盯着天花板有限的IAA廣告變現，而是用遊戲設計的思想拔高其調動LLM/其他生成式AI工具的價值。

病毒式傳播與玩家共創

AI原生遊戲不應該以"技術"為壁壘，也不應該以"AI"作為賣點，而是思考AI以外真正觸動玩家的體驗是什麼？最好得利用病毒式傳播、玩家共創等方法，圍繞玩法/體驗構建專有的數據庫，以此形成壁壘。

盡管我們聊到了諸多與生成式AI相似思想的遊戲原型，但"玩家并不需要兩個《王者榮耀》"，AI原生遊戲并非單純地再做一次相似作品，且核心賣點永遠是遊戲而非AI——AIGC+貪吃蛇，有趣之處仍然是貪吃蛇本體。當"AI遊戲"的概念即将被濫用時，AI以外的部分才是核心競争力，正如同鷹角、蠻啾、米哈遊也從未用"二次元"标榜自己。

同時，AI原生遊戲的成效也并不一定就屬于最早發布、最早擁有大量玩家關注的作品，而是要探讨如何圍繞體驗獲取更多玩家數據，以此迭代體驗、不斷循環，在細分體驗下構建競争壁壘。

這可類比于Midjouney，用户在Discord的每一次互動，既是獲得文生圖的反饋，也是為模型迭代提供數據，據此Midjourney能根據實際需求針對性地訓練模型以迭代體驗，形成數據飛輪。類似地，AI原生遊戲區别于傳統遊戲，也應當圍繞其設計，讓玩家的互動既是體驗的一部分，也同樣可轉化為迭代的養料。

為了吸引更多玩家，理解并結合好社區文化會是一大助力。考慮開發難度和傳播能力，紅極一時的小遊戲《人生重開模拟器》可能是不錯的試驗田，其Gacha式的互動推進和略顯荒誕的人生發展與AI有幾分相似，同時也具備病毒式傳播和二創的可能性——畢竟原版在第8天就已有10億次遊玩，并在此後衍生出魔法版、修仙版、爽文版等相似邏輯的作品。當這種思想接入生成式AI後，也許不只是純随機的對話，可以衍生出更多的玩法。

而跳出遊戲性本身，從壯大IP生命力的角度看，借力生成式AI的社區共創也非常值得探索——選擇能掩蓋生成式AI不易控制產出的短板，對"質量"要求不高，或者説本就接受浪漫主義、圖一樂的内容方向。

譬如《崩壞：星穹鐵道》在前段時間有場「無盡的三月七」圖生圖活動，模式簡單易懂。若按傳統影像生成的思想，想必是Prompt寫滿了諸如"Best Quality、Masterpiece、NSFW"等詞，出現奇怪的手、精致但沒靈魂屬于常态。

不過，對于二創而言，精美不是唯一出路，玩家自己玩得開心更重要，有時候整活兒才更具傳播力——在B站搜索關鍵詞，再按點擊量降序排列，似乎都是"怪東西"。但恰恰也是網友難以捉摸的想象力，将本不完美的圖轉化成QQ群裏的MEME，產生病毒式傳播。

從米哈遊這次活動説開去，發行側也可以将生成式AI打包為降低二創門檻的工具，并不一定是為了短期的整活兒，而是延續和擴展角色和遊戲故事，讓IP宇宙的内容更加健壯。例如，AI分鏡版、AI四格漫畫等，官方提供主題即可，其餘由粉絲放手開幹。

創作者

如果説上文是仰望星空，嘗試探讨AI原生遊戲會走向何方，那麼在這一篇章，我們得腳踏實地，回歸到這一切的根基——創作者。畢竟無論技術如何迭代，最稀缺的依然是一群懂遊戲、有審美、有開發能力的創作者，後文筆者希望探讨生成式AI如何作為Copliot輔助好開發與發行，讓人之價值回歸于人之本身。

降本：真正要減少的是溝通返工，倒逼上遊捋清需求

降低成本并非單純的裁員，而是設法降低溝通、返工、探索的摩擦損耗，捋清楚開發需求。

每當論及生成式AI對行業的影響，媒體和上市公司總喜歡把"降本增效"挂在嘴邊，但其中意藴相當朦胧，一直存在種刻板印象的誤解——仿佛"降本增效"等同于找到契機裁員，裁員後項目就能順利發展。

盡管研發費用的确在與日俱增，但做得不夠好玩，又如何靠省錢來獲利。如果真要論及人天節省的直接比例，比如PBR流程裏，早年的自動綁骨骼、自動展UV、生成LOD也不過是把原本0.5~1人天的工作量再縮短些，甚至還得人工復核破面、缺面等漏洞。

筆者認為，生成式AI對生產端的幫助更多是通過降低"溝通摩擦"和"探索試錯"的成本，倒逼從業者用奧卡姆剃刀原理想清楚設計意圖和核心體驗，從而提升效率，不是單純地優化人力。

作為一種復雜工程，提需求是開發者的一大要務，大模型也不可能直接服務于——"想個月流水過億的方案吧"。但相對地，ChatGPT、Stable Difussion等工具快速出稿的特性，在一定程度上能讓開發者厘清需求，圍繞項目的核心體驗和賣點，想好究竟要什麼、不要什麼。

畢竟，做加法是容易的，做減法是困難的，不少遊戲敗在缺乏主軸，產生冗餘設計和美術資產，沒有充分把資金花在服務于體驗的刀刃上。同時，策劃也可借助文生圖制作情緒版，更好地向美術同學傳遞需求，原畫也能用圖生圖反饋不同方案，與策劃快速達成共識，不必費功夫產出大量廢稿，尤其是涉及相對抽象的"温柔""帥氣""儀式感"等詞。同理，也可借助于Mubert、AIVA、Vits模型來試着生成音樂、配音小樣，在早期拿捏需求。

説到底，AI并不會替人想清楚，即便快速產出100張圖、100句話、100段BGM，也只會讓缺乏指導思想的開發者更加迷茫而難以取舍。某種意義上，學習AI，反倒是認清自己，是個"知道自己知道、知道自己不知道"的過程，積累知識、術語、閲讀量，以達到精準表達的目的。

增效：當基礎活兒靠Copilot節省後，人的核心能力将被放大

美術的工作重心是表達，而不是繪畫；UI的工作重心是互動，而不是圖示。AI Copilot時代促使創作者思考真正重要的是什麼。

凱文·凱利在接受采訪時曾提出個觀點——"人類 90% 的技能會被 AI 取代，剩下的 10% 會被放大。" 前半句的比例有多高并不重要，關鍵是充滿人本主義的後半句，即那些"人之所以為人"的事物是什麼。

以時下最火熱的2D原畫生成為例，回顧往昔，歷史的車輪總是有相似性。19世紀法國誕生了攝影，其靈感源自早年的繪畫輔助工具"暗箱" （小孔成像+畫家描摹），而作為世界首張"照片"，《勒格哈的窗外景色》乍一看頗為粗糙，還需要長達至少8小時的曝光，直到10年後達蓋爾将技術發展到新裏程碑，這群繪畫出身的藝術家才摸到些門路，不過依然沒找到"攝影"的獨特性，還在沿襲嚴謹的靜物構圖等傳統美術在做的事兒。

所以，不出意外的，彼時"繪畫已死"的論調成為争議焦點。但有趣的是，也有不少畫家開始用照片當繪畫參考——畢竟請模特、布景費用比較昂貴，但短時間内又無法完成畫作。同時，剛出生的攝影還引發了"繪畫是為了什麼"的思潮，随即在往後的30年間催生了以莫奈、塞尚為首的印象派（彼時還是挖苦用的貶義詞），同時也誕生了有獨立體系、更加原生于照相機的攝影師。而二者的發展也總是互為靈感，繪畫受攝影的影響不再只是求真，攝影受繪畫的影響也融入了更多主觀性和浪漫主義色彩。

回到生成式AI在文生圖的發展來看，總有些歷史的暗合，同樣經歷了"耗時太長且出圖不能看，到相對快速且質量提升"、"引發繪畫是為了什麼的思潮"等階段。

關于這個問題，正好翻閲到穆夏的作品，頗有感觸，美術最重要的應是表達。當手繪轉為板繪、3D輔助建模深入一線，工具正不斷地被迭代，觸動人心的卻總是精湛技藝背後的情緒和思想，而臨摹從不會被看成美術工作者的代表作。

由此，筆者也觀察到部分遊戲的概念藝術家正積極用結合了ControlNet的Stable Diffusion來做探索，尤其是風格轉化、頭腦風暴、快速驗證。

例如近期上映的《蜘蛛俠：縱橫宇宙》就有獨特、大膽且多變的渲染視效。也許藝術家在看完後就忽而有某種表達欲，可以将其放入Stable Diffusion+Midjourney，試着轉換成截然不同的風格，先且不論精細度和正确性，只求快速產出氛圍和情緒參考——打開腦洞，更好更快地產出屬于自己的作品，而無需慢慢找參考、找到後還得親自試着畫畫。節省時間之餘，還可能帶來有趣的元素。

此刻，2D美術生成已是如火如荼，快速出100張圖不是難事，但對遊戲而言，有意義的内容才真正稀缺。畢竟對持續内容更新的項目而言，單個版本可能只推出1~2個角色。尤其是内容向作品，需要對每個角色的設定、戰鬥配置、對應的驗證環境都精心雕琢，才更好作為商品賣出，并非以量取勝。

因此，若想直接用上生成式AI的產出，似乎更适合在那些"不覺之間"，例如投放素材、補間動畫、邊角背景、休閒小品。而在哪些部分投入，也正反向體現了遊戲的賣點，倒逼開發者将注意力放在表達和商業考量——

例如，擅長叙事的作品，講究情緒引導，真正缺的是懂關卡、懂燈光、懂3C調度等的遊戲導演，而不是堆砌文字；注重互動的作品，講究UI/UX的易用性、沉浸感、世界觀表達等，顯然不是Midjourney生成像模像樣的ICON那樣簡單粗暴......

無論如何，當生成式AI作為Copliot遲早替代基礎活兒後，反倒促進人的學習和思考，讓產出服務于價值本身。

近未來

每當新技術出現時，往往因其仍處在早期，會陷入一種"有點用但不多"的迷思，也容易有點"拿着錘子找釘子"的過度FOMO。不過事物發展總是螺旋演進的，需要理解好這把新錘子，不忽視也不鼓吹。筆者嘗試在該篇章分享些有趣的發展方向，聊點近未來。

盡管學界對以GPT-4為首的大模型究竟是"淺層統計模型"還是"習得内在規則"還存在較大的分歧，但不可否認的是，當前焦點依然是基于Transformer+Next Token Prediction的路徑，那如何打破Transformer不擅長處理長文本就是近期一大難題，畢竟普通GPT-4也只支持8000Token，會影響模型對字元間最長距離的支持和對上下文的計算壓力。

好消息是，Sam Altman近期在訪談提到會在2023年内開放最多支持100萬Token（約合75萬個單詞）的新GPT-4，并在2024年開放多模态GPT。類比于ControlNet不斷更新輸入條件，當輸入框大幅提升且支持非文本後，模型對材料的學習能力可能更上一層樓，也讓使用者的互動更靈活。

而當目光轉向影像生成領網域，礙于3D模型的信息密度高于2D影像/視頻、高質量數據少于語言模型、參數規模也不可比拟，暫未出現所謂的"湧現"現象。現階段最為矚目的Text-to-3D也多是"曲線救國"，先生成低分辨率的2D影像或者3D粗模再進行優化，面數也非常低，突破口大概率還得看英偉達。

值得期待即将在8月召開的SIGGRAPH，英偉達預計會發布20篇生成式AI相關文章，包括但不限于"将文本轉為個性化影像的新型AI模型"、"可以将影像轉為3d模型的渲染工具"、"能夠模拟復雜3D元素的AI驅動神經物理模型"，以及"生成實時視覺細節的神經渲染模型"。同期還有OpenAI的新模型Shape-E、以及基于Mesh生成的MeshDiffusion、國内無需3D數據直接文本生成帶紋理的Mesh模型或NeRF模型ProlificDreamer。

多數3D生成模型是基于模型庫訓練的，即無法生成非模型庫的内容，而MeshDiffusion可以基于Mesh生成訓練數據中不存在的全新形狀。不過面數還比較低，離工業還有點遠。

回歸當下，其實也有不少嘗試融入現有3D流程的工具，盡管可控性勢必與外包熟手相比欠了一層，不過依然有些小插件值得關注，例如專攻貼圖生成的BariumAI（已被Unity收購）、WithPoly，效果比單純Stable Diffusion生成的可能含後處理效果的貼圖靠譜，但諸如修改法線強度或者粗糙度還得人工來；再比如Blockade Labs近期推出的天空盒生成，輸入Prompt，可以得到360°旋轉、并且是無縫銜接的環境圖片。

現有圖形學的渲染方式受限于硬體已然成熟，但其流程也不乏僅僅服務于下遊的"中間品"。按PBR流程制作一個人形的3D角色，高模雕刻占比可能近50%的時間，而轉三視圖通常交給外包熟手搞定，展UV、删改LOD、蒙皮綁骨骼本就耗時不長，只是繁瑣枯燥。

若以更原生的思想來看，AI并非融入舊產線去跟高度熟練的外包搶活兒，而是嘗試構建一套新工作流（盡管如今還是存在想象中的科幻），不過目前的點雲、SDF、NeRF等路徑仍在實驗室階段，需要更長時間的探索。

至于代碼輔助、音樂生成、聲音轉換、無穿戴動捕等也有不錯的進展，可以預見，近期還會冒出不少AI Copilot型工具。不過，市場最稀缺的還是懂遊戲的產品經理，而非單純的工程師——畢竟對從業者而言，哪個好用、哪個好學就用哪個。參考遊戲引擎的歷史，好工具往往是一個好遊戲的附屬品，不然容易陷入"顱内自嗨"的窘境，若想搞ID Tech Engine就先搞個《DOOM》、搞Unreal就先搞個《虛幻競技場》，因此好工具得從遊戲團隊"長"出來，很難由硅谷工程師們憑空生造。

殊途同歸，AI原生Feature的探索最終都會回到遊戲開發本身，新生的火炬之光依然得由開發者舉起。而在路徑混沌、資源分配不均的當下，大廠和創業團隊尚未進入競争階段，二者都面臨各自的難題——譬如大廠得思考ROI悖論，費力煉制的模型是否對應充足的真需求，中台的研究離一線業務是否又太遠，懂AI又懂遊戲的CTO此刻身在何方...... 那麼，誰能掙脱桎梏，先行走出新路徑，誰就能獲得超額收益。四王抬棺，榮譽總是屬于開拓者。

尾聲，但并非結局

生成式AI的一切思考都不應盲目擁抱或排斥，唯有了解新技術的來龍去脈與本質，以發展和開放的心态去探索，回到最務實的生產流程和遊戲樂趣後，才能更好地與時代共振。

最後，援引曾供職于OpenAI的兩位科學家Kenneth Stanley和Joel Lehman在《為什麼偉大不能被計劃》一書所寫的話作為結尾——

偉大不是目标指引的結果，因為通往偉大的路線從來都不是直線，很多時候快反而就是慢。萊特兄弟發明飛機，最早用的是自行車技術；本來是用于驅動雷達磁控管的一個部件，意外成就了微波爐；第一台電子計算機用的是電子管，但電子管根本就不是為了計算機而發明的；YouTube最初的設想是一個視頻約會網站，後來發現人們喜歡在上面分享五花八門的視頻；比爾·蓋茨迎合極客打遊戲的需求，結果普及了個人電腦；埃隆·馬斯克起家是網上支付，最後卻推出了SpaceX和特斯拉……

也許，此刻，在世界的某個角落裏，一群夠Nerd的天才正發明令人嘆服的新"玩具"。

*文中所有圖片版權歸原作者所有，僅供分享交流不作商業用途，侵删

遊戲葡萄招聘内容編輯，