大模型創業300天：成者100億估值，80%敗者出局

今天小編分享的科技經驗：大模型創業300天：成者100億估值，80%敗者出局，歡迎閱讀。

作者：楊曉鶴，頭圖來自：視覺中國

2023 年，知名投資機構老虎基金募資不成的消息，悄然傳遍了整個互聯網。

在習慣了風口創業的過去 10 年中，" 投資人寒冬 " 似乎還是第一次出現。這與新消費、直播帶貨、元宇宙幾個風口悄然落幕，并購和中概股等退出渠道的大門半遮半掩，種種不利因素都息息相關，創投市場似乎要真正冷清下來。

創業公司融資艱難，大佬的二次創業也不好找方向。從美團退休的王慧文，研究了好一陣的 Web3 和元宇宙。被騰訊收購公司後離開的王小川，試水了 AI 醫療。但一切轉變在 2022 年末，ChatGPT 3.5 發布，迅速讓市場形成共識，AGI（通用人工智能）時代來了，全行業開始跑步入局大模型。

據了解，當時在低調創業的王小川，已經成立了公司做智能硬體。意圖幫助有睡眠障礙的上億人，打造一款治療打鼾的智能枕頭。當 3 月份大模型熱潮興起後，王小川用了 2 周時間做了決定，放下這個創業項目，布局大模型。

王小川找來原搜狗 CTO 楊洪濤幫忙接管醫療項目，原搜狗 COO 茹立雲在這家公司的股份，也兌給了楊洪濤，追随王小川的大模型創業。王小川共拿出 5000 萬美元成立 " 百川智能 "，并邀請了 Soul 的技術人才來做算法負責人，加速去做大模型。而王慧文的故事，大家就十分熟悉了，酒桌上發布英雄招募貼，成立光年之外公司做大模型。

在互聯網大廠中，大模型也帶來了翻天覆地的影響。有大模型的項目負責人，年前因為升職不成的問題，從而提出離職。年後 3 個月時間後，該集團 CEO 就成為大模型的總負責人，舉公司之力 All in 大模型。

沒有人想錯過這波 AGI 時代的浪潮，大家都相信 AI 在經過三起三落的發展後，通用人工智能的奇點正在來臨。畢竟在 AI 熱潮下，類似 ChatGPT 和 Midjourney 等幾十人規模的公司，創造 40 億美金左右的估值，美股 " 七巨頭 " 總市值一年飙至 11 萬億美元，大漲 60%。這些激動人心的爆發式增長的故事，再一次攪動了國内科技商業市場。

國内互聯網大廠中，李彥宏、張勇、張一鳴、王興等大佬都已經親自挂帥，可以說除了拼多多，已經全部入局大模型。正如 7 月 19 日，微軟和英偉達的市值增加了 1750 億美元，馬斯克在評價相關推文時驚嘆：" 瘋狂的時代。"

即将沉寂的科技商業市場，突然迎來了 AI 這一興奮劑，也讓互聯網進入了最後一次的狂歡。

一、谷底中燃起的新曙光

李明是一家創業公司的 CEO，團隊規模在 100 多人。2023 年是他最為融資發愁的一年。

最開始創業的過程十分順利，早期拿到知名天使投資機構的天使和 A 輪融資。" 那時候工業互聯網還是個熱門賽道，也不像很多 AI 項目那麼浮誇。" 李明告訴 AI 鲸選社，但 2023 年中，他在啟動的新一輪融資中，慢慢發現了行情不對。

投資機構不僅看數據和故事，還要看營收了。此前執着產品化的李明，根本還沒意識到，投資風向的變化。用梅花創投創始合夥人吳世春的話講，就是現在投資項目 " 既要（技術），又要（數據），還要（營收）"。沒辦法，他開始找 FA 機構幫助融資，而且融資輪次也退步，求個 A++。

"FA 幫找了 30 多家投資機構，都不了了之了。" 融資的不順利，讓李明有些洩氣。但在 6 月份，他感受到大模型的威力，于是内部上馬了基于 ChatGPT 的產業化業務。" 現在也還沒融到資，不過投資人會主動找來交流，對方明顯感興趣了。"

而對于袁進輝的一流科技來說，大模型也是個救命稻草。2022 年，這家做 AI 深度學習框架的公司，已經到了融資不順，不得不裁員生存的地步。此前公司 3 次瀕臨資金鏈斷裂，都是找天使投資人，也是當時快手 CEO 的宿華借錢。

" 做的事情和百度的飛槳、華為昇思差不多，最重要的是那時候市場大模型訓練的業務還沒起來。" 一流科技員工告訴 AI 鲸選社，公司屬于有錢的時候（2021 年）沒業務，有業務的時候（2023 年）沒錢了。

就在袁進輝感覺前途無望的時候，2023 年公司迎來了收購的機會。2023 年 4 月份，在清華科技園的一流科技公司内，迎來了一位貴賓，他就是剛剛宣布進軍大模型的美團聯合創始人王慧文。

最終的收購價格還可以，一位被裁員的一流科技的員工告訴我們，" 能與上一輪高瓴資本投資的估值相當，自己的期權也有着落了。"

而成為光年之外聯合創始人的袁進輝，終于再也不用為融資發愁。王慧文的融資能力，在當下創投圈無出其右。根據後來的美團收購協定顯示，光年之外在沒有大模型產品的情況下，就融資了 20 億元。

當然，這波行動中更早布局的投資人，已經成功狩獵到獨角獸。

Minimax 是在 2021 年 11 月成立，在 2022 年 1 月獲得天使輪投資，2023 年初公司估值就達到獨角獸級别。最早 4 家投資機構中，還有上海遊戲公司米哈遊，據悉是因為兩家創始高管中有家人關系。而據鲸選社了解，智譜最近也在以 100 億人民币的估值融資。

這兩家公司的成立時間都不到 2 年，卻都已經成為獨角獸，大模型賽道的發展速度驚人。

而 AGI 熱潮，對于那些老牌 AI 公司也是一次救贖。此前，出門問問的 IoT 上市故事，已經歷經幾次無功而返。伴随着大模型 " 序列猴子 " 和 4 款 AIGC 產品的故事推出，盡管其大模型還小心翼翼不對外公開測評，但也讓出門問問終于有了新故事可講，目前已經提交港股上市申請。

更多的大模型和 AIGC 創業者走在了路上，甚至在一家創業營裡，60% 的項目都和 AI 相關，擁有輕資產、高壁壘、天花板高的優點，AGI 徹底成為當下最火的賽道。

二、将 AGI 的夢想做到最巅峰

如果說 2023 年是大模型創業 " 元年 "。那麼互聯網大廠最早入局大模型的 " 源年 "，則可以追溯到 2019 年。

阿裡是 2019 年 9 月開始布局大模型，2021 年 4 月發布 PLUG 大模型。而早在 ChatGPT 3.0 面世之前，國内就已經有多家萬億參數的大模型，他們分别是達摩院的 M6 和華為雲的盤古大模型，以及智源的悟道 2.0。和 ChatGPT 相比，盡管模型參數超越了，但數據豐度不一樣，效果還沒法比較，在達摩院的張聰看來，國内大模型起大早趕晚集，最重要的是沒做兩件事。

第一件事是沒做對齊。那時候阿裡有很多大小模型，主要沒有做訓練結果對齊。" 你看現在 ChatGPT 能做詩會聊天，很像人的智力，實際上就是與人的價值觀對齊。" 張聰講道，這些都需要對推理結果進行人為調整，而不是用機器的邏輯去做。

第二沒有去做高質量的數據集，ChatGPT 早期利用菲律賓的大學教授進行數據标注，國内是利用中專生做标注，語料的問題也十分影響結果。在張聰看來，7 月 19 日公布的 Llama 2 的精調 Chat 模型，就是在 100 萬人類标記數據上訓練的，訓練 token 總數增加了 40%，相比 Llama 的提升是全方位的。" 所以大模型并不是大力出奇迹的發明，而是精心設計的工程創造 "。

并且反觀國内 AI 產業，也會面臨很多其他因素幹擾。當時，達摩院主要有兩個團隊做大模型，一個是金榕領導的機器智能團隊，司羅負責的是 AliciMind；一個是周靖人領導的自然語言實驗室，其中楊紅霞負責的是大模型 M6。

在 2022 年末的測評中，M6 大模型的成果稍具優勢，二者最終整合成現在的通義大模型。" 實際上，達摩院大模型團隊只有二三十人，主要它的預訓練，都放在阿裡雲。" 張聰告訴 AI 鲸選社，不過現在通義是集團的重要項目，涉及到的人員有 600 多人，現在很多資源都傾斜給大模型，集團 CEO 每 2 周過問一次技術進展。

而對于百度來說，這波 AGI 熱潮，可是自己從 2016 年就預言來臨的 AI 時代，自然也不會錯過。

今年 2 月 7 号在内部正式立項，3 月 16 号正式發布。這期間直接上升到百度集團優先級最高的項目，李彥宏親自督戰，CTO 王海峰博士直接挂帥，那時候百度陽泉超算中心就專門為大模型訓練。

百度算法工程師趙輝告訴 AI 鲸選社，百度自然語言處理部一直就在研究 NLP 等技術，首席科學家吳華也一直是領導，這個部門就有幾百人。百度的 ERNIE2.0 後轉成文心大模型，" 以前就在做百度大腦，現在都說是大模型文心麼。"

做的事情有相似，當然也有區别。趙輝提到，以前百度會做很多垂直搜索的 Rank，就是為了根據人為的點擊，重新排序搜索的結果。大模型出現後，這些能力都會被沉澱在大模型的算法中，也有利于給出的回答更精準。

對于百度來說，大模型推動下一代搜索質變，已經寫進了李彥宏的 OKR。不過，對于生态來說，百度的文心大模型是基于 bert 模式，" 包括智源的 GLM 都是獨立的技術路線，和國際的 GPT 并不一樣。" 一位百度雲的人員告訴 AI 鲸選社，這點其實倒也不用擔心，文心千帆什麼類型的模型都有，GPT2、3、4 也非常不同。

而說回從阿裡離職的楊紅霞，她在去往海外後，也被字節跳動挖去做北美大模型的研發負責人。張一鳴一直在研究大模型會開源還是閉源，所以也沒要求集中力量趕工。" 年底前會有真正意義上的突破。" 楊紅霞對 AI 鲸選社說道。

綜合來看，字節跳動應該是繼百度之後，在業務上與大模型更匹配的公司。有獵頭告訴我們，雖然大模型不着急，但在 AIGC 領網域還是挺激進。比如 TikTok 在做廣告創意業務 AIGC，總監職務給出預算 100~150W，要求是 88 後帶隊。

至此，互聯網大廠除了拼多多，已經全部入局大模型。大廠入局的熱情，甚至比當年的 O2O 和直播還有過之而無不及。

三、分水嶺突然出現的那一夜

6 月份，在北京搜狐大廈，光年之外這家融資最多的大模型企業，正熱火朝天地創業。

原一流科技的 Oneflow 深度學習框架還尋思繼續做，但被大模型業務抽調了很多人。可就在 6 月 23 日，突然有人在社交媒體上透露王慧文病了，當時公司還有人去求證，得到的是沒有這回事的消息。可是在 25 日晚，美團突然宣布聯合創始人王慧文因為抑郁症住院，辭去公司董事一事，其創業的光年之外公司面臨出手的新聞。

一時間，光年之外做不下去，王慧文提前跑路的新聞，成為一些人的猜測。AI 鲸選社從投資人圈得到的消息，是王慧文的病情确實很嚴重。最後王慧文睡在上鋪的兄弟，美團創始人王興幫助接盤了光年之外。

大模型真的不行了嗎？大家萌生出此疑問。那期間，正好知名投資人朱嘯虎和獵豹創始人傅盛也在朋友圈争論，大模型行業是否有泡沫。朱嘯虎極度看衰市場一擁而上，做通用大模型的現狀，認為絕大多數都會在年底死掉。

光年之外的主動變動，也是否印證了朱嘯虎的言論？

從 AI 鲸選社獲得信息看，收購了光年之外的美團，目前并沒有停止大模型的腳步。不僅獨家投資了智譜 AI 數億元，當下還在招聘大模型的項目總監，給出的年薪高達 300 萬元，甚至還在美國成立技術研究院。賺辛苦錢的美團，也并不想在這波科技大潮中落後，尤其在餓了麼明确要接入通義大模型，有業務競争的攜程，也已經推出了大模型之後。

但對于國内市場來說，通用大模型确實已經太多。據不完全統計，短短不到 8 個月時間，已經有超過 85 家大模型發布，其中很多成了上市公司的套現概念。

Wind 數據顯示，2023 年 24 家 "AIGC 概念股 " 已經合計發生 67 筆減持，大股東的離婚潮也令人驚嘆。2023 年初至今，近十家 AI 板塊公司大股東家庭被曝離婚。備受關注的是，A 股 AI 企業昆侖萬維，最近就發生占股 11% 的李瓊女士（創始人周亞輝的前妻），計劃減持 3% 的股份（大概 13 億元），然後有息借給公司。據了解内情的人向 AI 鲸選社介紹，感受到了 AGI 紅利的昆侖萬維，不僅做了大模型，最近還在密集組建團隊，全力以赴做對标微軟的 Copilot。

上市公司利用 AGI 抓緊炒概念，套現離場。大模型創業公司則在内卷到死。

一位在近期成立了 AIGC 基金的投資人張陽告訴我們，伴随着開源免費且強大的 Llama 2 襲來之際，下半年很多大模型企業勢必會面臨融資難的問題。

如今一切已經有端倪，在 7 月 11 日，百川智能推出了百億級别參數的大模型 Baichuan-13B，不僅宣布開源，同樣還是免費可商用。雖然 Baichuan-13B 的參數規模不大，但是基于精準的中文語料訓練，在百億規模參數的大模型中，百川經常排名頭部。

Baichuan-13B 的免費策略，大大衝擊了國内大模型付費行情。目前，智源 AI 就在 14 日宣布，企業登記獲得授權，允許免費商業使用 ChatGLM-6B 和 ChatGLM2-6B。

越來越多的大模型開源免費後，大模型的死亡淘汰賽正式開啟。一位基于大模型創業公司的 CTO 對 AI 鲸選社表示，智源的大模型從最開始的私網域部署要 2000 萬元，到年初的調用價格為 180 萬到 30 萬選包，再到現在的免費，行業變化非常之快。傅盛認為這是市場從大模型參數之争，進入生态規模之争。

互聯網大廠并不愁生态建設，由于内部模型非常多，也有免費和付費之分，最主要的大模型目前還是閉源和付費形态。創業公司要建立生态就比較困難，很多初創企業做大模型已花光了力氣，做生态就難免力有不逮。據了解目前 MiniMax 是創業公司中，為數不多堅持公有雲，做 MaaS 模式的大模型企業。

丁香園 CTO 範凱形容這波開源免費潮，就像把自來水廠（大模型）免費接到用戶家裡，讓每家人手一個水龍頭，那些閉源的自來水廠，最好你的水無敵好喝，大家才願意付費去你那。

四、AGI 發展進入分岔路口

分水嶺出現後，當下創業競争已經發展了三派。

一派是堅持全自研大模型，都是實力選手。這一派主要是百度、阿裡、字節等互聯網大廠以及智譜、MiniMAX、銜遠等創業企業。但這些實力選手也被劃抽成兩類企業。

第一類是堅持做自研的通用大模型，對标 ChatGPT，不斷追趕 ChatGPT 的迭代速度。

在雲啟資本董事合夥人陳昱看來，通用大模型是必經之路，垂直大模型發展受限。" 因為對于通用大模型而言，垂直領網域并不需要重新訓練，通用大模型可以通過向量數據庫做行業深化，垂直大模型卻很難智能湧現。"

從目前看，有夢想的肯定還要做通用大模型，畢竟做成了可以成為下一個互聯網大廠。ChatGPT 在協同辦公、電商、代碼生成、輔助設計等領網域已經展現出了這種颠覆性潛質。

第二類是認清現實聚焦落地，堅持做垂直大模型，這一派包括最後達成觀點統一的朱嘯虎和傅盛，二者都認為垂直大模型将更有產業适用性。

通用大模型一般是在千億參數以上，而垂直大模型則在百億或者 70 億規模左右。達觀數據的大模型產品曹植，參數就都在 500 億規模之間。

據達觀數據的 CEO 陳運文告訴 AI 鲸選社，" 曹植 " 大模型采用混合訓練數據方案，分别是 50% 的通用混合語料 +50% 垂直專業語料。" 我們在金融、政務等領網域做文本智能很多年，很多數據是獨有的，客戶也要求我們做私有化訓練。" 陳運文告訴 AI 鲸選社，" 以前四五個人用一個星期做一份報告，現在 AI 半天做好了。"

放棄成為下一個 ChatGPT 的夢想，才能在商業場景中盡早落地，這是很多垂直大模型的清醒認知。

在行業看來，通往 AGI 聖殿的第二條路線，是基于别人的模型（如 GPT），然後結合自己的行業 Know-how 去做訓練。" 對于第二類能不能成功，我覺得需要時間去驗證，現在還不明确。原因在于大家還不知道如何把行業 Know-how 去和大模型做融合的有效路徑，如何在有護城河的同時又有可持續的商業模式，這仍是個未知數。"

" 尤其很多大模型，本身就有套殼的嫌疑，" 投資人張陽告訴 AI 鲸選社，結合行業做商業化的時候，就會面臨很多問題。據悉，兩個知名同姓創業者的大模型，是基于 Faceboook 的開源 Llama；某遊戲和防護公司用的是智源大模型的基礎框架。

更強的開源大模型正在來襲，Meta 近期發布免費可商用版本 Llama 2，傅盛對此就在朋友圈表示：" 這一下不知道多少公司笑醒在深夜，多少公司哭暈在廁所 …." 朱嘯虎對此也評論道：很多人要笑醒了吧，大家都可以 Take free ride（搭便車）了。

傅盛的 " 笑醒 " 所指，和朱嘯虎略有不同。傅盛笑醒指的是使用開源大模型開發 AIGC 應用的企業，也能做出更好的產品，朱嘯虎笑醒是指那些号稱自研實則套殼的大模型企業，最近也要宣布更新了。大家所指的哭暈内容相同，都是那些号稱自研的大模型企業，國外大模型最強之一 Llama 2 宣布開源免費，大家都基于相同的開源大模型，怎麼在行業中做出特色能力？

AGI 的第三條路線是純粹做應用，是将模型拿來直接使用，這種的壁壘會較低。朱嘯虎也不看好這類模式，認為如果 90% 的能力是 ChatGPT 提供，那麼 AIGC 應用就沒有什麼投資價值。

在 OpenAI 的生态中，山姆 · 奧特曼承諾盡量避免做應用層，和生态開發者競争，因此效仿 Google 做了 ChatGPT Plugin，從目前看，國内還沒有誰做出這種承諾。

文心一言和通義千問，已經有了上百個功能更新，這些功能也覆蓋了一些開發者的工作。雖然文心一言也有插件，但目前就兩個，一個是百度搜索，另一個是 ChatFile（長文檔的分析處理能力）。百度千帆和阿裡魔搭的生态發展如何協調，還是個有挑戰的命題工作。

堅定看好 AGI 的朱嘯虎，認為通用大模型的創業和投資視窗期已過，不絕對依賴某家大模型能力的 AIGC，才是 AGI 時代低垂的果實。比如，近期朋友圈突然蹿火的 " 妙鴨相機 "，算是國内 AIGC 第一個爆火的產品，國外也曾火過類似的產品 "lensa"，月收入曾達到 800 萬美元。

時代的浪潮襲來之際，投資人吳世春就曾打趣問道朱嘯虎：" 投 AI 賺的錢把投 SaaS 虧的錢，彌補回來了嗎？" 朱嘯虎回答，還沒，但是 AI 的前景無限。

目前，創投圈也都認可朱嘯虎表達的道理，但很多人并不期待朱嘯虎說出實話，諸如 "ChatGPT 對創業公司很不友好，未來兩三年内請大家放棄融資幻想 " 這些帶有寒意的話。

" 大模型就是互聯網的房地產，就算有泡沫也是美麗的泡沫，"一位剛下場做 AI 職業教育培訓的創業者說道，雷軍曾在 2013 年互聯網紅利消失之際疾呼，要相信互聯網的力量，今天我們也要相信 AGI，無論它有沒有泡沫。

注：本文中李明、張聰、趙輝等為化名。