今天小編分享的互聯網經驗:AI的星星之火必将燎原,歡迎閱讀。
圖片來源 @視覺中國
文 | 李智勇
如果說過去的文章更多的是基于過去十年產業經驗對未來做的推斷,那 12 月當產品收入達到某個量級後就相當于是推斷得到了檢驗。這時候想到的反倒不是什麼未來願景,而是主席當年的那句老話:星星之火必将燎原。就好像看到了許許多多的火種,潛藏不太容易看到的層次上,一閃一閃冒着微弱的火光。
我對 AI 的信心從來沒像這一刻這麼強。這不是激進,和這篇文章要一起看的是:為什麼說 AI 現在還不行!看着有點矛盾,但其實是一個事情的正反兩面,統一于尺度判斷。
肯定會迎來一個 AI 原生應用的浪潮
之前文章更多是從圖靈測試 2.0 和智能原生到底應該定義成什麼樣子來做解讀,這次我們換個方法,舉一個發生在琢磨事這号對應群裡的具體且真實的例子。很不陽光,但仔細想想卻很有意思。
背景很簡單:琢磨事這号有個讀者群,群并沒什麼特别的商業化目的,純粹聚集了些對 AI 感興趣的同學日常聊聊天,比如做些文章中觀點和產業趨勢的探讨。入群的也都是做這個行業并且對 AI 有點想法的同學。
然後有趣的事情發生了。
不知道什麼時候群裡混入了一些特别的人。
我個人作為群主一般大家轉發到群裡的文章等都會看看,時間一長就發現有幾個同學不對勁,他們不定期發文章,可總的頻率很高,每次發的文章标題很火,但内容很稀薄,也很短,内容中間必然帶廣告。除了發文章保持絕對沉默,從不發言。
這群是只要不罵街,誰愛說點啥就說點啥的風格,所以最初我也不怎麼想理會。
可在某個瞬間,我突然意識到這不是真人,肯定都是些機器人。
從這個角度往回解讀,就發現雖然套路有點無賴,但确實是一個很小的 AI 原生應用。純血的。
我們想象下它後面的結構。
必然有一個聯通真實世界捕捉熱點的感知部分,從中選出對應的選題。
再針對選題自動生成内容。
生成内容的同時用爬蟲爬取對應的群,想辦法加進去(反饋環節)。這時候 200 人以下的群只要掃二維碼就能加入,所以估計是重點關注對象。
進一步還要标識對應的群的屬性,然後和文章的内容做匹配,再之後才是一定頻率的不定期發送。
這麼個應用,核有三個部分:一部分對大模型進行調度負責掃描和生產内容;一部分是日常任務比如發文的原則,一部分同現實進行接軌等。
對現實進行感知,基于大模型進行内容生產,然後内容反饋回現實的世界,并在浏覽的環節嵌入盈利環節。
典型新式智能原生應用。就是你很難想到會用這麼個形式冒出來。
上面說的結構大概率和之前說的 Agent 結構 80% 雷同:
和過去應用對比那裡不同了
從技術角度看,基于過去的技術,不用大模型也不是完全不能做,尤其是對于做爬蟲的兄弟。但過去很難這麼做出錢來。(即使現在我也不知道這玩意能不能賺到錢,很想找到這幫哥們問問數,就當騷擾我好幾天的成本了)
原因特别簡單:當 AI 不足夠成熟,你其實做不出那麼多訂閱号文章,并且還都匹配實時熱點。
所以說這種應用是真的新類别的應用(當然也可以叫 Agent)。它從感知到生產到盈利全場景是閉環的。
從我們經常說的圖靈測試 2.0 的視角就是:它能夠在一個完整商業場景上閉環,不需要人的介入,并且近似全自動的行動。行動的結果可以創造收入。
一旦這種場景成立,那這種應用就可以拿走對應那個場景下的,智能邊界内的價值。
做上面這類應用的同學,未必會像我這做戰略出身的人,天天琢磨套路,更可能就是覺得這事能幹就幹了。現在還少,但當廣大產品和程式員同學了解到打造這麼個東西成本可能和旅遊一次差不多的時候,估計做的人會越來越多。
可這種敏銳感知不是沒限度的,通常最終還是會貼着套路走(經常說的從特殊到一般,一般再到特殊的過程)。
上面這個例子正好契合了之前提到的套路的關鍵點:
純粹數字空間,幻覺影響不大,通過圖靈測試 2.0 等。
智能原生應用不是 AIGC 工具
還是要區分下這類應用和純粹内容生成的工具。
雖然兩者都頂着 AI 的帽子,但卻有本質性差異。
AIGC 工具本質上算法驅動,只有極少數的人在天時地利具備的情況下才可能。商業模式極其難以跑通。
智能原生應用的關鍵則落在應用上,是綜合了技術後的產品力,這種產品力要能打破最後那 1 毫米的障礙。其實大多數人都能做并跑出現金流。這事我們并不陌生,當年的 APP 不就這樣麼。
過去是英國人在一戰的時候發明了坦克,但坦克的真正發揚光大其實要等待德國人弄出來閃電戰。
AIGC 工具和智能原生應用的差别與此類似。
AIGC 工具是坦克,而每個智能原生應用都是一場獨特的戰役。
對于 AIGC 工具,模型的獨特性是關鍵的,對于智能原生應用,深研模型本身可能反倒是有害,更需要往外看,在技術和場景的結合處定位準。
順道一說,智能原生應用也不是 GPTs。
加上 GPTs 的 chatGPT 自己其實就是一個超級智能原生應用,覆蓋最為通用的場景。
這就是智能原生應用所隐喻的廣闊空間
幾乎每個領網域都會出現這類更加智能和自動的智能原生應用。
所以現在剛剛露頭的各種嘗試才是星星之火。
并且随着大模型能力的持續提高,火苗只可能越來越大,而範圍會越來越廣。
會從上面那個極其無聊的場景擴展到各個方面。而當下差不多就是 Windows 應用的 1995,移動互聯網的 2007。
真做起來還是很費勁,但能做了。
對于智能原生應用而言第一關鍵的是圖靈測試 2.0。
雖然前面提到過幾次這裡還是要再說下,因為它實在像風筝的那根線一樣,決定了不飄不行、但飄的太遠也不行的尺度。
什麼是智能原生應用和圖靈測試
智能原生應用不飄是不行的,因為過去就沒有這玩意,不飄,你就想象不出來產品需要定義成什麼樣子。
太飄也不行,太飄有點像本來想開飯店,然後發現路不行,決定先修路然後再開飯店。(大部分做智能原生應用的會很像開飯店的那個,OpenAI 這些才是修路的)。
這樣一來就需要一個中間的尺度。
這個尺度決定生死成敗,重要性排第一。
第一決定在特定時間長短事到底行不行,第二決定了礦究竟有多大。
還是前面那例子,那個場景其實能通過圖靈測試 2.0,然後礦究竟大不大取決于你内容生成的質量。
我們從應用這個角度重新描述一下圖靈測試 2.0。
圖靈測試 2.0
原始的圖靈測試這樣:
這是一個純粹的智能測試,本質是追求在封閉系統裡面的邏輯自洽性。
現在我們把 Agent 類似的概念加入這個測試:
這就是圖靈測試 2.0。和 1.0 相比核心差異是什麼呢?
去幻覺,有邊界。
1.0 是一個凌空的系統,具有合理性的幻覺其實有助于通過測試,但 2.0 不行,測試者同時從真實場景和被測試者接受反饋;其次就是測試邊界的限定要求更高的智能深度,這很像趙括學兵法能說的天花亂墜,但不一定能打仗;會打仗不一定兵法上什麼都懂,但水站、陸戰、馬站好歹得會一個。
還是上面那個例子,這個例子下 1.0 和 2.0 共通的部分是生成的内容人要能看,2.0 獨有的部分是你生成的内容得是符合基礎事實的,也要有點特色和風格,因為你的閱聽人不是就看你,也看别的文章,純胡扯廣告估計點擊率會低。
如果純粹的胡扯被認為是個人,從技術角度可以算通過 1.0 測試,但從商業角度則沒那麼有價值,轉化率就差。
自己對自己的實現
能否通過圖靈測試 2.0 的判斷與 AIGC 能力其實是絕配。
前者定義了技術在商業場景下的價值,而 AIGC 能力其實降低了實現它的成本。
從這個角度看技術内定了自己的實現,這種必然性,不管從因果角度還是從偶然的角度解讀都是很有趣的事情。
小結
即使方向對,也有能力,真做起來也會萬分痛苦,這會像在無人區裡奔跑。但這也正是價值所在,當所有的隐性知識都變成顯性知識之後,絕大部分商業價值會消失,會變成一個角力的遊戲,那就無趣的很了。
最後如果覺得上面的文章言不盡意,那麼下面這個組合可以讀讀,這其實說的是一個事的不同側面。我比較确定他們是對,并且在這個早期是有價值的。
與此相關的一套文章包括: