今天小編分享的科技經驗:邁向2024,AI創業有哪些新機會?,歡迎閱讀。
2023年12月,《自然》雜志發布年度"科學十大影響人物"榜單,今年有史以來首次有"非人類"入選了——名單中包括了ChatGPT。《自然》指出:"盡管ChatGPT并非個體,也不完全符合評選标準,但我們決定破例列入,以承認生成式人工智能正在從根本上改變科學的發展軌迹。"
在2023年的科技版圖上,生成式AI無疑标志着一個重要的轉捩點。它的發展不僅引起了業界廣泛的關注,也對全球經濟、社會結構乃至我們對未來的預期產生了深遠的影響。
這是每個普通人都可以參與的AI革新。從大型語言模型的持續發展,到AI技術在不同行業的廣泛應用,再到開源與閉源策略之間的持續較量,AI的每一步發展都在描繪着未來趨勢的輪廓。
面對滔滔浪潮,國家先後在《"十四五"國家信息化規劃》《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》中出台了一系列支持AI發展的政策措施。中國的人工智能產業規模也快速壯大,湧現出一批具有國際競争力的AI企業。
時逢年末,我們回顧2023年生成式AI的發展,從技術對人類的影響、行業格局和未來發展趨勢、創業和投資機會等方面展開論述。這不僅是對AI領網域過去一年的發展回顧,更是對AI發展走向的思考。
先分享核心結論:
在真正有價值的AI應用生态繁榮之前,押注大模型這樣的核心技術源頭及"賣鐵鍬"公司是有一定道理的。但目前正在蓬勃發展中的AI應用,同樣是價值創造的源泉和我們要追求的星辰大海。
像OpenAI這類閉源大語言模型,會向接入其端口的APP應用收取流量費。應用公司為了降低流量費用的負擔,一種方法是利用開源模型,自己訓練出一個中小模型,另一種方法是優化商業模式,從而平衡流量費用。
随着AI技術的進步,工作方式也會發生變革。AI技術既可能重構人們的工作流,也可能重構語言模型本身的工作流。
如何用好AI這樣極其智能的工具,對人類來說無疑是巨大的挑戰。但是,我們也不要那麼悲觀,AI的能力是有邊界的。
在AI技術領網域,美國和中國的發展路徑各有特色。美國的頭部大語言模型陣營已基本确立,中國的大型語言模型呈現了百花齊放的态勢。對于中國來說,更重要的是大力發展AI應用生态。
AI Agent是個值得關注的創業方向。AI Agent是一種能夠自主執行任務、獨立決策、主動探索、自我迭代并能相互協作的智能軟體。
雖然大語言模型領網域已經實現了眾多技術突破,但仍然有不少可以迭代、提升的板塊,比如減少"幻覺"、增加上下文長度、實現多模态、具身智能、進行復雜推理以及自我迭代等等。
AI應用領網域創業的幾個要點:要做出優質的原生新應用體驗;更前瞻、發現非共識、有颠覆性;關注用戶增長和商業化潛力;把握宏觀趨勢紅利;跟大模型保持安全距離,有自己的業務縱深;最重要的還是團隊。
創業公司要敢于在非共識的領網域,做正确而非容易的事。
希望能帶來新的思考角度。
一、2023年,AI領網域有哪些新變化?
AI發展至今,從業界的角度來看,可以分為兩個階段:1.0階段主要集中于分析和判斷,而2.0階段更側重于生成。2.0階段的代表模型是大型語言模型和影像生成模型,Transformer和Diffusion Model這兩個算法模型推動着生成式AI的發展。(更多關于生成式AI的思考,歡迎閱讀《ChatGPT爆火之後,AIGC往何處去?| 峰瑞報告28》)
2023年的大部分時間,OpenAI這家初創公司的產品穩居大型語言模型高性能的榜首,特别是在3月OpenAI發布GPT-4語言模型之後,幾乎是一騎絕塵。但Google在12月成功發布最新的大型語言模型Gemini,與GPT-4形成雙雄割據的格局。
在AI領網域,開源模型社區一直沒有缺席。開源模型社區在Meta(原Facebook)的開源大型語言模型LlaMa及LlaMa2的支持下,進行着密集的科研和工程迭代,比如:試圖用更小的模型,釋放出與大模型類似的能力;支持更長的上下文;采用效率更高的算法和框架來訓練模型等等。
多模态(影像、視頻等多媒體形式)已經成為AI領網域研究的熱點。多模态分為輸入和輸出兩個方面。輸入是指讓語言模型能夠理解影像和視頻中蘊含的信息,輸出是指除文本之外,生成其他媒體形式,比如文生圖。考慮到人類生成和獲取數據的能力是有限的,未必可以長期支撐人工智能的訓練,未來可能需要用AI自己合成的數據來訓練語言模型。
在AI基礎設施領網域,英偉達憑借其GPU的巨大市場需求,成為行業的領導者,跻身1萬億美元市值俱樂部。但是它也将面臨來自老對手AMD、英特爾等芯片制造商,以及Google、微軟、OpenAI等大廠和語言模型新貴的激烈競争。
除大模型外,業界對各種類型的AI應用有強烈的需求。生成式AI在影像、視頻、編程、語音以及智能協作應用等多個領網域取得了顯著進展。
全球用戶對生成式AI展現出極大的熱情。ChatGPT在短短2個月内,達到1億月活躍用戶數。相比智能手機時代的超級應用們,在大量推廣預算之下,TikTok用了9個月,Instagram用了2.5年,WhatsApp用了3.5年,YouTube和Facebook用了4年。
▲ 不同類型的科技應用達到1億月活躍用戶的時間。圖片來源:7 Global Capital
創投機構也在投入重金,支持AI領網域的進展。根據美國投資機構COATUE的統計,截止至2023年11月,風險資本投資機構向AI領網域投入了近300億美元,其中約60%投向OpenAI等大型語言模型新貴,約20%投向支持和交付這些模型的基礎設施(AI雲服務、半導體、模型運營工具等),約17%投向了AI應用公司。
▲ 圖片來源:COATUE
在真正有價值的AI應用生态繁榮之前,這種押注核心技術源頭及"賣鐵鍬"公司的投資邏輯是有一定道理的。但目前正在蓬勃發展中的AI應用,同樣是價值創造的源泉和我們要追求的星辰大海。
1. 多模态生成領網域出現多項技術突破
2022年,在Stable Diffusion開源之後,我們見證了大量"文生圖"(由文字生成影像)產品面世。這一年可以被視為影像生成問題的解決之年。
緊接着在2023年,用AI識别聲音、生產音頻的技術也取得了顯著進展。如今,AI的語音識别和合成技術已經非常成熟,合成聲音與人類聲音很難被區分。
随着技術的持續發展,視頻的生成和處理将是下一個階段AI發展的重點。目前在"文生視頻"(由文字生成視頻)領網域已經出現了多項技術突破,AI在視頻内容生成方面展現出了潛力和可能性。借助AI視頻新秀Runway Gen-2、Pika以及斯坦福大學的W.A.L.T等模型及應用,用戶只需輸入對影像的描述,就能得到一段視頻片段。
英偉達知名工程師Jim Fan認為,2024年,AI大概率要在視頻領網域取得進展。
圖源:X.com
如果我們換一種維度,來思考不同形态的媒體格式,那麼一張二維的影像,如果增加一個時間的維度,就變成了視頻。如果增加一個空間的維度,就變成了3D。如果将3D模型經過渲染,我們就能得到更加可精确控制的視頻。可能未來AI也能逐漸攻克3D模型,但還需要更長的時間。
2. "壓縮即智能"
2023年,OpenAI的首席科學家伊利亞·蘇茨克維(Ilya Sutskever)在某次外部分享中,提出一種"壓縮即智能"的觀點,即語言模型對文本的壓縮比越高,就說明它的智能程度越高。
壓縮即智能,可能不一定嚴謹,但卻提供了符合人類直覺的解釋:最極致的壓縮算法,為把數據壓縮到極致,勢必需要在充分理解的基礎上,抽象出更高層次的意義。
以Llama2-70B這個Meta研發的語言模型為例,它是Llama2模型700億參數版本,是目前最大的開源語言模型之一。
Llama2-70B使用大約10T(10萬億)字節的文本作為訓練數據,訓練出來的模型是一個140GB大小的檔案,壓縮比大約是70倍(10T/140G)。
在日常的工作中,我們通常把大的文本檔案壓縮成Zip檔案,其壓縮比大約是2倍左右。對比之下,可以想見Llama2的壓縮力度。當然Zip檔案是無損壓縮,語言模型是有損壓縮,不是一個标準。
▲ OpenAI副總裁Andrej Karpathy分享截圖。圖片來源:Web3天空之城
神奇的地方在于,一個140GB的檔案就可以把人類的知識和智能給保存下來。大部分的筆記型電腦都可以裝得下140GB的檔案。當筆記型電腦的算力和顯存足夠大,只要再加上一個五百行的C代碼程式,就可以運行大語言模型。
二、開源生态和大語言模型的流量稅
1. 開放研究和開源生态是推動AI發展的重要力量
▲ 開源生态促進了AI技術創新。圖片來源:Coatue.com
開放研究是AI技術發展的基礎。全球最頂尖的科學家和工程師在Arxiv等網站發表大量論文,分享他們的技術實踐。無論是早期的AlexNet卷積神經網絡模型,還是奠定算法基礎的Google的Transformer,抑或是OpenAI、Meta等公司發表的模型實踐論文,都是科研和技術上的重大突破,引領着AI技術發展。
開源社區的發展和迭代尤其值得關注。在開源大語言模型的支持下,科研人員和工程師可以自由地探索各種新的算法和訓練方法。即使是閉源的大語言模型,也能向開源社區學習和借鑑。
可以說,開源社區實現了某種程度上的科技平權,讓全球的人們都能共享AI領網域的最新技術成果。
2. 大型語言模型的"流量稅"
回歸商業本質,大型語言模型的訓練成本是非常昂貴的。以GPT為例,據遠川研究所統計,訓練GPT-3用了超過1000萬美金,訓練GPT-4用了1億多美金,下一代模型的訓練成本可能要達到10億美金。此外,運行這些模型并對外提供服務的時候,其算力和能源的消耗也是很昂貴的。
大型語言模型的商業模式是MaaS(Model As a Service),它輸出智能的計費方法是按照輸入輸出的流量(或稱token,詞元)來收費。由于大語言模型昂貴的訓練和運行成本,它收取的流量費大概率會"水漲船高"。
▲ 圖片來源:openai.com
以OpenAI為例,上圖是其官網所展示的部分模型的流量計費方案。有人做過粗略估計,按照AI應用調用GPT-3.5 Turbo流量的中位數水平,只要有一個用戶每天使用該應用(DAU),用戶背後的APP公司約需要向OpenAI支付0.2元人民币左右的流量費用。以此類推,如果是千萬級别日活的APP應用接入了GPT的端口,那麼每天要向OpenAI支付200萬人民币的流量費。
▲ 圖片來源:微信公眾号@AI賦能實驗室
國内大模型的流量費報價如上圖所示,跟OpenAI的價格基本相當。部分中小模型會便宜一些,但性能有差距。
流量費用會影響到AI應用如何設計商業模式。為了降低流量費用負擔,有些創業公司會考慮利用開源生态的能力,自己做一個中小模型,去承接大部分的用戶需求。如果碰到超出中小模型能力範圍的用戶需求,再調用大型語言模型。
這類中小模型,可能會被直接部署在離用戶最近的終端側,稱為"端側模型"。端側模型很考驗硬體的集成水平,未來我們的電腦和手機上,可能會更廣泛地集成GPU之類的硬體芯片,具備在終端側運行小模型的能力。Google、微軟已經推出可以在終端側運行的小模型。Nano是Google發布的Gemini大模型中最小的一款,專門為在移動設備上運行而設計的,無需聯網,可以直接在設備上本地和離線運行。
三、AI如何影響了人類社會?
1. 每一次技術革命,都會帶來新的效率工具
人類歷史上有幾次大的技術革命。1760年左右興起的第一次工業革命,產生了機械設備;1860年之後的第二次工業革命,產生了電子設備;1970年之後,我們又經歷了計算機軟體、PC互聯網和智能手機這三次技術革新,有人統稱其為第三次工業革命即信息革命。
2023年開始的生成式AI革命,或許可以被稱為第四次工業革命,我們創造了新的智能。生成式AI是人類認知和改造世界的新工具,已經成為新的抽象工具層。
根據歷史經驗,每一次技術革命都會極大提升人類生產效率。第一次和第二次工業革命後,自然世界形成了兩個抽象工具層,即機械和電子設備層。20世紀70年代,以計算機為代表的信息技術革命引入了新的抽象層——軟體。通過軟體,人們開始以更高效的方式理解、改造世界,并與之互動。随後,PC互聯網和智能手機崛起,進一步推動了軟體技術的發展。
2. AI如何影響人們的工作?
除了關注AI帶來的效率提升,我們還要關注機器如何替代了人類的工作。據統計,英國第一次工業革命之前,農業人口占比約為75%,而工業革命之後降至16%。美國信息革命之後,工業人口從38%降至8.5%,當時那些工業人口大多轉變成白領人口。而這次AI的智能革命,首當其衝的正是白領人群。
随着AI技術的進步,商業社會中的組織形式和協作方式可能會發生一系列變化。
首先是,公司可能往小型化發展。商業外包可能會變得非常普遍。比如,公司可以把研發、營銷等板塊外包出去。
其次是工作流的重構,也就是标準操作程式(SOP)可能會發生變化。每個人的能力和精力有所不同,因此,工作流能夠讓人們提高效率,各司其職。研究人員正在探索在AI可能替代某些職能的情況下,人們的工作流該如何調整。當前的語言模型也存在可以提升效率、增強能力的地方,語言模型可能也需要借助工作流的編排,進行協作。
除了技術技能之外,提高其他能力也變得至關重要。例如,提升鑑賞力和品味,才能讓AI輔助你生成更好的方案或者作品。再比如,增強批判性思維,能幫助你更好地判斷、鑑别AI生成的内容。
我們要更積極地利用AI,把它當作工作和生活中的輔助工具,或者說副駕駛,充分利用其潛力和優勢。(更多關于未來工作的思考,歡迎閱讀《未來,人類會怎麼工作?| 峰瑞報告26》)
3. AI的能力是有邊界的
在AI發展迅猛的當下,不少人提出了AI威脅論,擔心AI對人類造成的負面影響。确實,人類目前發明出了看起來比自己還聰明的工具。如何控制好AI這樣的"矽基生物",對人類來說無疑是巨大的挑戰。科學家們正在嘗試解決這個問題,OpenAI也曾發表探讨類似問題的論文。
但是,我們也不要那麼悲觀,至少目前人類社會的數字化程度,可以限制AI的能力邊界。
如今的大語言模型主要是用大量文本數據訓練出來的。文本的數字化程度很高,又經過人類的抽象,信息密度大,所以AI訓練的效果很好。
但是離開了文本空間,AI的智能會受到諸多限制,因為它沒有經過相應的數據訓練。所以我們暫時不用太擔心,AI并沒有那麼厲害和全面。我們有充足的時間去熟悉和适應它,找到跟矽基生物友好相處的方法。
四、展望2024,大語言模型與AI應用會如何發展?
1. 頭部大語言模型陣營
在全球範圍内,大型語言模型呈現出顯著的區網域化發展特征。比如,美國和中國的發展路徑各有特色。美國的頭部大語言模型陣營已基本确立,主要集中在幾家大型科技公司,或者它們跟幾家頭部模型創業公司的聯合體。可以說,美國的AI領網域已進入高成本的軍備競賽階段,新的參與者比較難入局。
而中國的大型語言模型則呈現了百花齊放的态勢,目前有百餘個項目聲稱正在開發大型模型。中國可能更依賴于開源生态,二次開發出新的語言模型。
目前,除美國以外的其他國家,都還沒有開發出與GPT-4相當的大型語言模型。在大模型技術領網域,中國和美國仍然存在差距。
但全球在AI領網域的較量還未到終局。對于中國來說,最重要的是大力發展AI應用生态。在互聯網和數字經濟時代,中國就是應用領網域的優秀生,也向海外輸出了相關的應用實踐。在緊跟大模型最新技術的前提下,等應用生态繁榮起來之後,我們再反向去做技術突破,可能是一種解決思路。
2. 大語言模型會如何發展?
雖然大語言模型領網域已經實現了眾多技術突破,但仍然有不少可以迭代、提升的板塊,比如減少"幻覺"、增加上下文長度、實現多模态、具身智能、進行復雜推理以及自我迭代。
首先,我們來讨論"幻覺"現象。幻覺可以理解為一種錯誤的輸出,Meta将其定義為"自信的假話"。幻覺的產生最常見的原因是語言模型采集的知識或數據的密度不夠。不過,幻覺也可以被視為創造力的體現,就像詩人在酒後能寫出美妙的詩篇,AI的幻覺可能也會給我們帶來奇妙的内容。
減少幻覺的方法有很多種,比如使用更高質量的語料庫進行訓練;通過微調和強化學習來提高模型的準确性和适應性;在模型的提示詞中加入更多背景信息,讓模型基于這些信息更準确地理解和回應問題。
第二,增加上下文長度。上下文長度相當于語言模型的腦容量,現在通常是32K,最高的是128K,也就是不到10萬字或者英文單詞。如果想讓語言模型理解復雜的語言文本、處理復雜的任務,這個長度還遠遠不夠。下一代的模型大概率會努力擴大上下文長度,以提高處理復雜任務的能力。
第三是多模态。人類主要依靠視覺來獲取信息,而當前語言模型主要依靠文本數據來做訓練。視覺數據能夠幫助語言模型更好地認知物理世界。在2023年,視覺數據被規模化地加入到模型的訓練過程中。比如,GPT-4引入了多模态數據,Google的Gemini模型據說也使用了大量的影像和視頻數據。從Gemini演示視頻的表現來看,它的多模态互動似乎有明顯提升,但復雜推理等智力的提升還沒看出來。
第四是具身智能,是指一種基于物理身體進行感知和行動的智能系統,能夠從環境中獲取信息、理解問題、做出決策并行動。這個概念并沒有那麼復雜,地球上所有的生物,都可以說是具身智能。比如人形機器人,也被認為是具身智能的一種形式。具身智能相當于給AI延展出了能活動的"手腳"。
第五是復雜推理。通常,GPT會一次性地給出回答,沒有太明顯地多步推理或回退迭代。而人類在思考復雜問題的時候,會在紙上列出一些步驟,反復推演和計算。研究人員想了一些方法,比如借助思維樹等思考模型,試圖讓GPT學會復雜的多步驟推理。
最後是自我迭代。現在的語言模型主要還是依靠人給它設計算法,提供算力,給它喂數據。暢想未來,語言模型能夠實現自我迭代嗎?這可能要依賴于新的模型訓練和微調方法,例如強化學習等。據說OpenAI正在嘗試一種代号為"Q*"的訓練方法,研究如何讓AI自我迭代,但具體進展尚未知曉。
大模型還處在高速發展期,還有很大的提升空間。除了以上列舉的幾點之外,還有很多待解決和提升之處,比如可解釋性、提升安全性、輸出的内容更符合人類的價值觀等等。
3. 未來的應用軟體:AI Agent
2023年9月,紅杉美歐(Sequoia Capital)官網發布了《Generative AI’s Act Two》的文章,提到生成式AI已進入第二個階段。第一個階段主要集中在語言模型及周邊簡單應用的開發,第二個階段的焦點則轉向研發真正解決客戶需求的智能新應用。
未來的應用軟體,可能會逐漸轉向AI Agent——一種能夠自主執行任務、獨立決策、主動探索、自我迭代并能相互協作的智能軟體。現有的傳統軟體可能需要進行相應的調整和改進。和傳統的1.0版本軟體相比,AI Agent能夠提供更接近真實的、高質量的一對一服務體驗。
但發展AI Agent的難點在于,語言模型目前還太不成熟和穩定。如果要做出好的應用體驗,需要在語言模型基礎上,加上一些小模型、一些規則算法,甚至在某些關鍵環節加入人工服務,從而在垂類的場景或者具體行業中輸出穩定的體驗。
多Agent協作已經成為熱門的研究方向。在标準操作程式的基礎上,相互協作的多個AI Agent,能夠產生比單獨調用語言模型更優的效果。這裡有個比較符合直覺的解釋,每個Agent可能各有優缺點和專攻方向,跟人類的分工是一樣的,大家組合到一起,通過新的标準操作程式(SOP)各司其職、互相啟發和監督協作。
五、創業和投資機會
1. 在非共識的領網域,做正确而非容易的事
在一個新的時代,作為創業公司,需要認真思考,基于這次技術革新,有哪些原生新模式的創業機會。同時還要考慮,哪些是新進入者的機會,哪些是現有行業領先者的機會。
我們可以回看PC互聯網和智能手機兩次技術變革,如何產生出了新的機會。
PC互聯網時代,提供的主要能力是連接,即全球的PC、伺服器和一些其他設備實現了聯網。PC時代產出的原生新模式包括:搜索、電商和社交通信等,誕生了BAT等各行各業的領先企業。
智能手機時代,提供的主要能力是大部分人都擁有一台手機,具備移動互聯、GPS、攝像頭等功能。這個基礎條件讓共享經濟、即時通訊、短視頻分享、移動金融支付等新模式成為可能。前一時代的行業領先企業是有很強先發優勢的,搶占了不少新模式的機會,例如:騰訊和阿裡分别做出了微信和支付寶。但是我們也看到美團、抖音和滴滴等一些新勢力,獲得了巨大成功。它們為什麼可以做到?
我認為其成功的關鍵詞是,在非共識的領網域,做正确而非容易的事情。
以美團和抖音為例。美團選擇的原生新模式叫"餐飲外賣",屬于"共享經濟"中的"O2O(線上到線下)"部分,左邊大量的餐飲店面,右邊是眾多各式各樣的消費者,中間是成千上萬的騎手,是"重模式",但早期互聯網大廠更喜歡和擅長做"輕模式",切入餐飲行業是"非共識"。外賣的履約服務鏈條太長、難以數字化,很難進行精細化運營。
再看抖音,它選擇的原生新模式叫"短視頻分享",屬于當時流行的"創作者經濟"的一部分。抖音最大的"反共識"是:它把視頻創作者經濟跟萬億體量的電商GMV之間的橋梁打通了,形成規模化、有效率的轉化。所以,抖音的海外版TikTok出海後,很多當地的短視頻和直播平台都打不過它。因為TikTok并不僅僅是一個左邊創作者右邊消費用戶的視頻内容平台,它更是一個新型的創作者經濟和海量電商GMV轉化的結合體,是新物種,具備復合型競争優勢。
總結來說,創業公司要敢于選擇和進入非共識的領網域,在艱難的環境下,努力把事做成。
2. 創業方向和要點
從創業的方向來說,大模型領網域巨頭林立,大概率不會是創業者的首選方向。而在大模型和應用之間有個"中間層",大部分是基礎設施、應用框架、模型服務等,這個部分容易受到模型和應用的雙向擠壓,部分領網域巨頭林立,創業空間不大。
綜上所述,我們傾向于認為,結合目前的技術和商業環境,我們應該大力發展AI應用生态。
上圖是我們投資的生成式AI相關的創業公司,包括:為語言模型設計的新型DevOps平台、社交遊戲平台、智能陪伴服務、AI輔助RNA藥物開發、門店自動化營銷、服務全球的智能商業視頻SaaS、新型線上心理咨詢平台和中美工程師遠程雇傭工作平台等等。
我們總結了AI應用領網域創業的幾個要點:
第一,要做出優質的原生新應用。要抓住AI智能時代提供的新能力,即智能供給和藝術創作力供給,做出優質獨特的原生新應用體驗,這個難度其實不小。我們在上文曾提到,語言模型的智能等還不夠成熟穩定,存在明顯的能力邊界。創業公司可能需要選擇相對垂直細分的場景,采用各種技術和運營手段,做出良好體驗。
第二,非共識、更前瞻、有颠覆性。非共識指的是在賽道選擇上不要随大流,敢于進入艱難的領網域,"做正确而非容易"的事情。更前瞻是指選擇有挑戰的業務和技術路線。
例如,采用當下還在發展、更先進的技術架構,例如:創業者要優先做Agent而不是CoPilot,CoPilot們更像是行業領先者的機會(想想微軟和Github)。再比如,創業團隊可以考慮提前按照下一代語言模型的能力(如GPT-5),去構思和設計應用。
颠覆性是指最好對所切入的行業產生颠覆效果,例如:颠覆性的產品體驗、颠覆原有的商業模式等等。這類颠覆性的好處是有可能跑在行業領先者前面。
第三,關注用戶增長和商業化潛力。用戶增長潛力很重要,大家容易理解,即便你從一個細分市場切入,未來也可以做成大的規模。
我們早期為什麼要關注商業化呢?
這要回到我們在上文提到的大模型的流量稅。如果你選擇接入大模型,從創業的第一天開始,你就要給大模型支付流量稅。
面向個人用戶的應用,當前規模商業化的途徑通常有三種:前向收費(如遊戲、增值服務等)、廣告以及電商。只有極少數應用有可能把電商做起來(例如淘寶、抖音等)。新應用直接向用戶收費很難,大多數創業者會有畏懼心理,會考慮選擇比較間接的方式,希望做大用戶規模後在應用裡做廣告來商業化。
從智能手機時代的情況來看,除了電商應用之外,中國最頭部的幾個泛資訊類APP估計每天能夠在單個活躍用戶上賺到的廣告收入大約在0.1元到0.3元之間,這已經是廣告商業化的極致水平。而一般規模的APP,可能還遠遠達不到0.1元。
我們在前面講過語言模型的"流量稅",每個用戶每天的成本約0.2元,廣告收入通常很難覆蓋得住這樣的成本。用戶規模越大,虧損反而越嚴重,除非你通過前面提到的端側模型等手段把"流量稅"降下來。
因此,AI應用在商業模式設計上可能需要優先考慮前向收費。當然,在新的AI智能時代,說不定我們的創業者可以找到除上述三種規模商業化之外的其他商業化途徑,讓我們拭目以待。
第四,把握宏觀趨勢紅利。要預判和抓住中國的宏觀趨勢紅利,比如商品出海、視頻電商、工程師紅利等等。我們要努力抓住屬于時代的β。
第五,跟大模型保持安全距離,有自己的業務縱深。安全距離大家應該有所耳聞,知名的海外反例有不少,比如一些生成文案的商業應用公司,雖然實現了"昙花一現"式的快速增長,終究難以逃脫大模型和其他創業公司的雙向衝擊。此外,創業項目的業務縱深也很重要,這個業務縱深是指大模型夠不着的地方,特别是一些難以數字化或者數字化不充分的場景。
當然,最重要的還是團隊,技術要好,團隊成員也要懂行業和場景,所謂"技術為先,場景為重"。