今天小編分享的互聯網經驗:歡迎來到提示詞的美麗新世界,歡迎閱讀。
圖片來源 @視覺中國
钛媒體注:本文來源于微信公眾号創業邦(ID:ichuangyebang),作者 | 王藝,編輯丨海腰,钛媒體經授權發布。
與大模型一同誕生的提示詞(Prompt)已成為 AI 領網域繞不開的概念。
Sam Altman 在與領英聯合創始人 Reid Hoffman 對談時表示,五年後我們将不再需要提示詞工程(Prompt Engineering),或者只需在這方面做少量工作;将來的 AI 系統不會因為增補了某個特定詞就產生截然不同的輸出,而是可以較好地理解自然語言。用戶只需以文本和語音形式輸入指令,就可以讓計算機完成影像生成、資料研究、心理咨詢等復雜任務。
Sam Altman 的表态讓外界普遍認為其不看好提示詞的前景。
但 Sam Altman 的不看好,針對的是提示詞工程,而不是提示詞本身。
在大模型愈發完善,愈發成熟的未來,以提示詞工程的形式,讓大模型更好的理解自然語言大可不必,但提示詞本身卻有着無限可能。
紅杉一代目 Don Valentine 曾回憶,自己見過最會提問題的人是喬布斯和紅杉二代目 Michael Moritz。
提示詞的本質是好問題,而不是提示。不管有多好的大模型,好問題永遠都有價值。
01 提示詞產品創新浪潮
提示詞的發展是與生成式 AI 和大模型的發展緊密相關。
在去年 8 月美國科羅拉多州藝術博覽會上的作品《太空歌劇院》大火之後,Midjourney、Stable Diffusion、DALLE 等 AI 繪畫大模型迅速火爆全網,相伴而生的是各類 AI 繪畫提示詞網站和課程,比如做提示詞交易市場的 PromptBase、做提示詞生成器的 AI 畫廊等。
第二波浪潮是 ChatGPT、尤其是 GPT-4 發布後,用戶看到了 AI 聊天機器人的強大實力,開始探索各種各樣提示詞的玩法,"Prompt Engineer" 這一職業也應運而生,抖音上出現了很多打着 " 成為年薪百萬的提示詞工程師 " 的旗号售價 199、299 等的提示詞課程,門檻費用在 200-1000 不等的提示詞社群、知識星球等也如雨後春筍般出現。
第三波浪潮則是今年 11 月 GPTs 發布之後,提示詞的創作過程和使用場景發生了極大的變化—— GPTs 通過對話的形式,将一些 " 原始提示詞 " 封裝在了一個小小的對話機器人裡,用戶通過和 GPT 對話(對話的過程也是輸入原始提示詞的過程)創造出自己的 GPTs 之後,可以自用也可以分發,GPTs 能夠基于其原始的訓練數據,更加高效、專業地解決用戶問題。
GPTs 發布之後,一批非官方的 GPTs 商店如 Supertools、Suefel、GPTs Hunter 等如雨後春筍般出現,用戶對 " 手搓大模型——打造自己的 GPTs" 表現出了前所未有的熱情,搞出了數據分析、學術論文、英語學習、武林秘傳、塔羅測算、為你寫詩、模拟老爸……等形形色色的 GPTs。截至 12 月 16 日,也就是 GPTs 開放給用戶之後大約一個月的事件裡,GPTs Hunter 上已匯聚了 61818 個 GPT,而整個 ChatGPT 上的 GPTs 數量更是遠遠超過這個數字。
GPTs 讓人們的想象力和創造力得到了極大的發揮,他們搞出了一些相當 " 炸裂 " 的 GPTs:
比如 AI 產品經理陳财貓制作的 " 提示精靈小富貴(Prompt Pet)",可以讓用戶通過輸入需求獲得自己想要的提示詞;
比如,有國外大神制作了一個名為 "Grimoire (魔法書)" 的 GPTs,它可以被看做一個 " 無代碼編程系統 ",用戶通過輸入一句話、或者不斷和 Grimoire 進行對話,就可以創建網站和應用程式。
再比如,品牌設計師兼作家 Jackson Greathouse Fall 在今年 3 月 15 日給了 GPT-4 100 美金,然後讓它命令自己做各種各樣的事情。ChatGPT 先是讓他做了一個環保主題的網站,去賣各種各樣的周邊產品;然後 ChatGPT 教他怎麼樣用 DALL · E 2 設計這個網站的 logo,甚至給了 DALL · E 2 的 prompt 讓他直接放入這個模型裡面;接着,教他怎麼樣去寫一個網站,給了他一部分的源代碼,他很快就把這個網站搭好了。到後來,GPT 甚至還告訴了他應該怎麼樣去融資,幫他做了一個融資商業計劃書的 PPT 。
一周後,HustleGPT 幫他賺了 130 美元,在 Discord 上獲得了 2095 個粉絲;Jacson 也真的獲得了一個天使投資人的投資,他現在公司的估值是 25000 美金。
這三波 AI 浪潮在讓人們驚嘆技術發展速度的同時,也助推了 " 提示詞 " 這一概念的熱度。越來越多人關注到了這一領網域,開始尋找 " 提示詞 " 更多的可能性,「INFOARK 方舟」社區主理人劉芮麟就是其中一位。
劉芮麟此前是一家互聯網醫療公司的内容負責人,也是最早一波接觸 ChatGPT 的用戶之一。ChatGPT 發布之後,他發現原本一天需要 10 個小時才能完成的工作只需要四個小時就能完成,這讓他十分激動,開始探索各種 AI 工具的同時,也成為了一名 AIGC 領網域的忠實信徒。今年 6 月,他離職創業,和幾個朋友一起推出了「INFOARK 方舟」社區。
INFOARK 方舟社區原名 "Info.Ark 明日方舟 ",是一個 AIGC 領網域的開源知識庫,主要提供 AIGC 領網域的基礎知識、相關課程、信息源推薦、學術論文、工具介紹等内容。目前 INFOARK 主要聚焦的賽道是提示詞領網域,在 INFOARK 方舟社區主文檔中,提供了關于 Prompt 非常詳細的原理介紹、相關教程和指令庫, 即使是小白也能輕松閱讀。
目前,INFOARK 社區已經積累了不少付費用戶,劉芮麟的創業團隊也通過知識星球訂閱、高端付費課程和企業合作商單獲得了穩定的現金流。
然而,這并不是他們最終想要達到的目的,在他們看來,INFOARK 方舟社區只是聚攏流量的第一步,他們真正想要做的,是一個類似最近大火的卡通片《萬神殿》裡 " 上載智能(Uploaded Intelligence)" 的東西——一個數字化的 " 第二大腦 "。
" 我們認為人類的智能還有很大一部分沒有被開發,比如很多人數學不好是因為沒有數形結合的思維,可能需要開發一款產品,通過可視化、數形結合的方式讓人理解數學;再比如人腦的信息過濾能力是有限的,無法處理海量的信息。那麼我們就要找到一套過濾信息的手段。這都意味着,你需一套基于 " 第二大腦 " 的軟體來幫助你,更好的構建你的心智算法、心智模型。這套心智算法和心智模型是‘軟體’,是需要依附在硬體之上的,它存在于人的肉身之上可能會消亡,但是存在于計算機硬體之上不會,因為硬碟是可以拷貝和轉移的,但是這要消耗巨大的能量。和機器相比,人類最後的尊嚴可能是,利用極少的能量,調用我們體内的‘認知模型’去消化知識、獲得洞見,這是人類相比于機器的優勢,有點類似于‘直覺’。
我們應該強化這種優勢,因此我們想做一個‘知識生命周期管理’的產品,它能夠模拟人的心智,實現知識的創造 - 繼承 - 利用 - 分發 - 銷毀這一整套的流程,把人類在認知和心智上的優勢流傳下去,構建一個類似 Avatar 的‘數字分身’,它聽起來可能和筆記軟體比較像,但是它的輸入方式和思考方式與筆記軟體完全不同,是通過對話的方式進行的。我們會設計一種新的 Prompt ——「一套問題體系」去和你聊天,通過這套問題體系,它就能獲知你的内在價值觀、認知模型、決策模型等底層的心智算法,從而構建出你的模拟‘第二大腦’ ",劉芮麟說。
在劉芮麟看來,Prompt 是一種數據清洗、把信息處理得更加 " 工程化 " 的手段,由于在大模型的訓練過程中,不斷追求用更低成本實現更好的訓練效果,所以才出現了 Prompt。他認為,Prompt 最大的價值就在于怎麼把隐性知識通過流程化、标準化、自動化變成顯性知識;好的 Prompt 包含對業務的理解和思考,好用的 Prompt 流程應該是一個系統化的流程,而好用的 Prompt,則應該封裝成為解決實際問題的工作流,這也是他們在未來的 " 第二大腦 " 產品中所要做的嘗試。
除了劉芮麟,同樣在 Prompt 領網域做知識付費的還有袁六偉。
袁六偉是知識星球 "AI 指令俱樂部 " 的主理人,也是 ChatGPT 發布後民間最早一波自學成才的指令工程師。他為海爾、科大訊飛等三十多家公司定制過 Prompt,一條 Prompt 的報價在 5000-2 萬元不等,通過指令定制實現了月入 10 萬,也通過對 Prompt 的深度鑽研創辦起了沒有技術背景的 "2 人公司 ",依靠指令定制、訓練營、付費咨詢、付費社群等方式,獲得了一年近百萬的營收。
袁六偉認為,Prompt 未來會有兩種發展路徑:在普通用戶側,随着 AI 對語義的理解越來越深,Prompt 會變得越來越簡單易上手,越來越接近自然語言;在專業用戶側,Prompt 會發展成一門 " 語言 ",類似編程語言一樣,會有專門的 Prompt Engineer 職位來使用 AI,比如科研、數據分析、技術開發、内容創作等垂直領網域,需要專門的指令工程師來設計和優化 Prompt,以引導 AI 進行復雜的任務。
" 未來 AI 肯定會像電力一樣,成為人們生活中的基礎設施,但是 AI 真正的價值在于‘服務’。OpenAI 官方肯定會打磨一些指令嵌入到大模型當中去,讓用戶更好地使用,但是人的需求是多種多樣的,官方沒有這個精力也沒有這個能力去覆蓋各個領網域的指令,所以在垂直領網域,就需要我們這樣各行各業的專家們去打造指令。我認為 Prompt 會像現在的編程語言一樣會成為一門語言、一門學科,它的市場會比編程語言大百倍、千倍,因為它是基于自然語言的,它的閱聽人範圍和使用場景比編程語言大得多 ",袁六偉說。
02 技術派眼裡的提示詞
如果說劉芮麟和袁六偉代表了非技術派的觀點,那麼在技術派眼裡,提示詞還有非常多可改進的地方和想象空間。
雲中江樹是最近火熱的 " 結構化提示詞 " 寫作範式的發起人,也是 GitHub 上有着 8k+ star 的「ChatGPT 中文指南」項目和有着 2k+star 的「LangGPT」項目的作者、EmbraceAGI 開源社區的聯合創始人。LangGPT 項目給提示詞設定了一套 " 模板 " 和 " 框架 ",通過設定層級結構、标識符、屬性詞等形式,讓很多小白用戶通過完形填空的方式就能輕松寫出效果還不錯的提示詞。
以調教 GPT 生產 " 詩人 Prompt" 為例,LangGPT 寫出來的提示詞是這樣的:
而當我們把這套提示詞輸入 ChatGPT,它給出的結果是這樣的:
雲中江樹向我們分享了一個他心目中用 LangGPT 結構化提示詞方法撰寫的最酷的提示詞案例:一個超級酷的老師,擅長使用最簡單的詞匯和通俗的語言來教會 0 基礎的學生。
上述提示詞的作者李繼剛是一位互聯網產品經理,他同樣也是有着技術背景的提示詞愛好者。他認為,圖片生成領網域,現在基本做到了去 Prompt 化,以前的很多咒語性的寫法,現在都不太需要了;但是在文字生成領網域,提示詞還是需要的。
李繼剛提出了提示詞的 " 織夢理論 " ——寫提示詞的過程是在為大模型營造一個 " 夢境 ",寫 Prompt 就是在織夢,Prompt Engineer 就是織夢師。"Prompt" 就像一根根線索,引導 ChatGPT 走進你所編織的夢境深處。織夢師的技巧越高超,通過 Prompt 織出的夢境就越真實,越能讓 ChatGPT 成為 " 夢中人 "。
雲中江樹和李繼剛都把 Prompt 看做AI 時代的編程語言,而且都旗幟鮮明地反對 " 提示詞消亡論 "。
" 提示詞有一個非常明顯的特點,它用的是自然語言,各個國家都能用自己的語言去使用它和機器進行對話。如果你把它看做一門編程語言,那麼會得出兩個結論——第一,編程人員會變多,只要有賬号、能訪問大模型的人都可以編程,那麼各種千奇百怪的創意也會多一些;第二,編程人員會分化,一定是有一波人鑽研的比較深(提示詞工程師)、另一部分比較淺(普通用戶),提示詞工程師會嘗試着把織夢這個事情做得更重、更結構化、邏輯更復雜,而普通用戶端則是更加輕量化、更容易的撰寫提示詞。一個往前端的方向走,一個往後端的方向走,一切都是為了夢中人對話的那個環節更加輕量化。" 李繼剛說。
而基于上述結論,李繼剛認為,微調模型的時代會到來,各家公司一定會把自己的數據結合大模型的能力去微調,形成自己公司獨有的 " 小模型",這種 " 小模型 " 更貼近應用場景、理解能力更強,也是 GPT-4 到 GPT5 所必然要經歷的一種演化路徑。
雲中江樹則認為,未來的提示詞可能是多模态的。" 提示詞本身不但不是過渡產品,反而是產品演進的長期趨勢。随着多模态大模型技術發展,未來我們可以将表情包、動态視頻等都作為提示詞的一部分,我們得到的輸出,也可以是圖文音并茂的結果。Prompt 的上限并沒有被拉低,反而因為這種東西的出現,Prompt 的上限還被提高了。"
《ChatGPT 進階 提示工程入門》的作者陳财貓同樣提到了未來提示詞會變得 " 多模态 " 的觀點。他認為,随着 AI 技術的進步,Prompt(提示詞)可能會消失,但是 "Prompt Engineering(提示詞工程)" 會持續存在。
陳财貓将 Prompt 分為了兩類:
第一類是彌補 AI 缺點的 Pompt。此類 Prompt 的作用主要是 " 彌補 " 模型能力的不足;
第二類是 " 幫助 AI 理解人類需求 " 的 Prompt。我們實際上是通過 Prompt 來給 AI 定義一個目标,交代清楚業務,幫助它理解清楚人類的需求。
針對第一類 Prompt,一個很經典的例子是 " 掃地機器人遇到狗屎沒有避開 "。一個掃地機器人在遇到狗屎的時候沒有避開,反而繼續 " 清潔 "。結果就是髒東西拖滿了整個屋子。這種情況下,提示詞工程師就不得不下類似于 " 掃地的時候要避開髒東西,不要把它拖得全屋都是 "," 遇到髒的地方需要多掃幾遍 " 這種看似廢話的 Prompt。
這其實是 AI 智能程度低,或理解人類需求(對齊)不足的表現。然而,随着技術發展的日新月異,我們甚至都不用等模型本身改進,一些產品上的設計就可以解決掉一些這種 case。因此,此類 Prompt 可能會很快退出歷史舞台。
針對第二類 Prompt,同樣以機器人掃地為例,假設現在 AI 很聰明了,不僅知道見到狗屎要避開,還知道拿一個小鏟子把它鏟起來丢掉。但是在你家掃地就要有你家的規矩,比如必須先掃客廳再掃廚房,打掃的時候不準發出一點聲音;如果遇到你的女朋友,還必須 " 向尊敬的少奶奶請安 ";為了增強娛樂效果,這個機器人還要一邊打掃一邊做後空翻。
在這種情況下,就算 AI 再聰明,它也很有可能搞不清情況和我們想要的效果,這就是 " 不懂業務 "。這時候,我們需要用很清晰的語言把業務規則列出來,比如用特定的順序打掃 " 的 " 順序 " 是什麼樣的。因此,第二類 Prompt 還可以存活很長一段時間。
此外,陳财貓還提到了提示詞發展的一個很重要的趨勢——去設施化,現在以軟體與功能為中心的人機互動會演變成以 AI 為中心的人機互動,用戶只要說一句自己的需求,不需要任何介質,AI 就能立即實現用戶的需求。
" 這段時間最讓我印象深刻的是一個叫「Open Interpreter」的開源項目,這個項目的官方宣傳标語叫’ A new way to use computer ‘——’使用電腦的新方式’,也就是說,你可以随時向它下命令,AI 就會去分析、計劃,然後寫代碼實現你的需求。舉個例子,在以前我們要做一個功能或者軟體,這背後需要寫需求文檔 - 過評審會 - 開發 - 測試等一整套復雜流程。但是現在, AI 越來越強,就算這個需求在世界上只有你一個人有,它也有可能寫代碼當場滿足你 ",陳财貓說,"在這種情況下,想法就會變得比實現有價值的多。"
03 提示詞的下一個趨勢:GUI+CUI
如果上述設想太過遙遠,那麼未來一到兩年,生成式 AI 和提示詞的下一個趨勢是什麼?
知名提示詞工程文檔 LearningPrompt.wiki 的創作者、開源應用 PoleStar Chat 創始人 Jimmy Wong 堅信,是GUI(Graphical User Interface,圖形化互動界面)+CUI(Conversational User Interface,對話式互動界面)結合的產品。
他認為,一個通過 GUI 彌補 CUI Prompt 不足的很好的例子是,以 ComfyUI 為代表的文生圖、文生視頻工作流。
ComfyUI 是一個基于節點流程式的 Stable Diffusion AI 繪圖工具,它可以将 Stable Diffusion 的流程拆抽成節點,以實現更加精準的工作流定制和完善的可復現性。
ComfyUI 的界面直觀易用,AI 繪畫的每個步驟都被拆成了一個節點,比如加載模型 ( Load Checkpoint ) 、采樣器 ( KSampler ) 、提示詞 ( Prompt ) 等都是以節點的形式存在,用戶可以快速上手并輕松繪圖。
通過 ComfyUI,用戶可以用微調節點、修改筆觸或者提示詞的方式,就可以實現實時的 AI 繪畫效果。它比傳統的文生圖大模型最大的優勢就在于 " 指哪打哪 " ——之前我們總是吐槽 AI 繪圖全靠抽卡,但是 ComfyUI 的出現讓文生圖變得可控了。同時,ComfyUI 還可以制作 AI 動圖、生成 AI 動畫,效果不輸 Runway 和最近大火的 PIKA。
" 現在是 Stable Diffusion 模型的戰國時代,而且相對 LLM 來說沒有像 OpenAI 那樣的巨頭存在。我認為 AI-Native 產品可能會出現在這個領網域,甚至明年都有可能出現 AI 生成的電影。對于小創業者來說,這可能是更有機會的方向 ",Jimmy Wong 說。