今天小編分享的互聯網經驗:大模型創業300天:成者100億估值,80%敗者出局,歡迎閲讀。
作者:楊曉鶴,頭圖來自:視覺中國
2023 年,知名投資機構老虎基金募資不成的消息,悄然傳遍了整個互聯網。
在習慣了風口創業的過去 10 年中," 投資人寒冬 " 似乎還是第一次出現。這與新消費、直播帶貨、元宇宙幾個風口悄然落幕,并購和中概股等退出渠道的大門半遮半掩,種種不利因素都息息相關,創投市場似乎要真正冷清下來。
創業公司融資艱難,大佬的二次創業也不好找方向。從美團退休的王慧文,研究了好一陣的 Web3 和元宇宙。被騰訊收購公司後離開的王小川,試水了 AI 醫療。但一切轉變在 2022 年末,ChatGPT 3.5 發布,迅速讓市場形成共識,AGI(通用人工智能)時代來了,全行業開始跑步入局大模型。
據了解,當時在低調創業的王小川,已經成立了公司做智能硬體。意圖幫助有睡眠障礙的上億人,打造一款治療打鼾的智能枕頭。當 3 月份大模型熱潮興起後,王小川用了 2 周時間做了決定,放下這個創業項目,布局大模型。
王小川找來原搜狗 CTO 楊洪濤幫忙接管醫療項目,原搜狗 COO 茹立雲在這家公司的股份,也兑給了楊洪濤,追随王小川的大模型創業。王小川共拿出 5000 萬美元成立 " 百川智能 ",并邀請了 Soul 的技術人才來做算法負責人,加速去做大模型。而王慧文的故事,大家就十分熟悉了,酒桌上發布英雄招募貼,成立光年之外公司做大模型。
在互聯網大廠中,大模型也帶來了翻天覆地的影響。有大模型的項目負責人,年前因為升職不成的問題,從而提出離職。年後 3 個月時間後,該集團 CEO 就成為大模型的總負責人,舉公司之力 All in 大模型。
沒有人想錯過這波 AGI 時代的浪潮,大家都相信 AI 在經過三起三落的發展後,通用人工智能的奇點正在來臨。畢竟在 AI 熱潮下,類似 ChatGPT 和 Midjourney 等幾十人規模的公司,創造 40 億美金左右的估值,美股 " 七巨頭 " 總市值一年飙至 11 萬億美元,大漲 60%。這些激動人心的爆發式增長的故事,再一次攪動了國内科技商業市場。
國内互聯網大廠中,李彥宏、張勇、張一鳴、王興等大佬都已經親自挂帥,可以説除了拼多多,已經全部入局大模型。正如 7 月 19 日,微軟和英偉達的市值增加了 1750 億美元,馬斯克在評價相關推文時驚嘆:" 瘋狂的時代。"
即将沉寂的科技商業市場,突然迎來了 AI 這一興奮劑,也讓互聯網進入了最後一次的狂歡。
一、谷底中燃起的新曙光
李明是一家創業公司的 CEO,團隊規模在 100 多人。2023 年是他最為融資發愁的一年。
最開始創業的過程十分順利,早期拿到知名天使投資機構的天使和 A 輪融資。" 那時候工業互聯網還是個熱門賽道,也不像很多 AI 項目那麼浮誇。" 李明告訴 AI 鲸選社,但 2023 年中,他在啓動的新一輪融資中,慢慢發現了行情不對。
投資機構不僅看數據和故事,還要看營收了。此前執着產品化的李明,根本還沒意識到,投資風向的變化。用梅花創投創始合夥人吳世春的話講,就是現在投資項目 " 既要(技術),又要(數據),還要(營收)"。沒辦法,他開始找 FA 機構幫助融資,而且融資輪次也退步,求個 A++。
"FA 幫找了 30 多家投資機構,都不了了之了。" 融資的不順利,讓李明有些泄氣。但在 6 月份,他感受到大模型的威力,于是内部上馬了基于 ChatGPT 的產業化業務。" 現在也還沒融到資,不過投資人會主動找來交流,對方明顯感興趣了。"
而對于袁進輝的一流科技來説,大模型也是個救命稻草。2022 年,這家做 AI 深度學習框架的公司,已經到了融資不順,不得不裁員生存的地步。此前公司 3 次瀕臨資金鏈斷裂,都是找天使投資人,也是當時快手 CEO 的宿華借錢。
" 做的事情和百度的飛槳、華為昇思差不多,最重要的是那時候市場大模型訓練的業務還沒起來。" 一流科技員工告訴 AI 鲸選社,公司屬于有錢的時候(2021 年)沒業務,有業務的時候(2023 年)沒錢了。
就在袁進輝感覺前途無望的時候,2023 年公司迎來了收購的機會。2023 年 4 月份,在清華科技園的一流科技公司内,迎來了一位貴賓,他就是剛剛宣布進軍大模型的美團聯合創始人王慧文。
最終的收購價格還可以,一位被裁員的一流科技的員工告訴我們," 能與上一輪高瓴資本投資的估值相當,自己的期權也有着落了。"
而成為光年之外聯合創始人的袁進輝,終于再也不用為融資發愁。王慧文的融資能力,在當下創投圈無出其右。根據後來的美團收購協定顯示,光年之外在沒有大模型產品的情況下,就融資了 20 億元。
當然,這波行動中更早布局的投資人,已經成功狩獵到獨角獸。
Minimax 是在 2021 年 11 月成立,在 2022 年 1 月獲得天使輪投資,2023 年初公司估值就達到獨角獸級别。最早 4 家投資機構中,還有上海遊戲公司米哈遊,據悉是因為兩家創始高管中有家人關系。而據鲸選社了解,智譜最近也在以 100 億人民币的估值融資。
這兩家公司的成立時間都不到 2 年,卻都已經成為獨角獸,大模型賽道的發展速度驚人。
而 AGI 熱潮,對于那些老牌 AI 公司也是一次救贖。此前,出門問問的 IoT 上市故事,已經歷經幾次無功而返。伴随着大模型 " 序列猴子 " 和 4 款 AIGC 產品的故事推出,盡管其大模型還小心翼翼不對外公開測評,但也讓出門問問終于有了新故事可講,目前已經提交港股上市申請。
更多的大模型和 AIGC 創業者走在了路上,甚至在一家創業營裏,60% 的項目都和 AI 相關,擁有輕資產、高壁壘、天花板高的優點,AGI 徹底成為當下最火的賽道。
二、将 AGI 的夢想做到最巅峰
如果説 2023 年是大模型創業 " 元年 "。那麼互聯網大廠最早入局大模型的 " 源年 ",則可以追溯到 2019 年。
阿裏是 2019 年 9 月開始布局大模型,2021 年 4 月發布 PLUG 大模型。而早在 ChatGPT 3.0 面世之前,國内就已經有多家萬億參數的大模型,他們分别是達摩院的 M6 和華為雲的盤古大模型,以及智源的悟道 2.0。和 ChatGPT 相比,盡管模型參數超越了,但數據豐度不一樣,效果還沒法比較,在達摩院的張聰看來,國内大模型起大早趕晚集,最重要的是沒做兩件事。
第一件事是沒做對齊。那時候阿裏有很多大小模型,主要沒有做訓練結果對齊。" 你看現在 ChatGPT 能做詩會聊天,很像人的智力,實際上就是與人的價值觀對齊。" 張聰講道,這些都需要對推理結果進行人為調整,而不是用機器的邏輯去做。
第二沒有去做高質量的數據集,ChatGPT 早期利用菲律賓的大學教授進行數據标注,國内是利用中專生做标注,語料的問題也十分影響結果。在張聰看來,7 月 19 日公布的 Llama 2 的精調 Chat 模型,就是在 100 萬人類标記數據上訓練的,訓練 token 總數增加了 40%,相比 Llama 的提升是全方位的。" 所以大模型并不是大力出奇迹的發明,而是精心設計的工程創造 "。
并且反觀國内 AI 產業,也會面臨很多其他因素幹擾。當時,達摩院主要有兩個團隊做大模型,一個是金榕領導的機器智能團隊,司羅負責的是 AliciMind;一個是周靖人領導的自然語言實驗室,其中楊紅霞負責的是大模型 M6。
在 2022 年末的測評中,M6 大模型的成果稍具優勢,二者最終整合成現在的通義大模型。" 實際上,達摩院大模型團隊只有二三十人,主要它的預訓練,都放在阿裏雲。" 張聰告訴 AI 鲸選社,不過現在通義是集團的重要項目,涉及到的人員有 600 多人,現在很多資源都傾斜給大模型,集團 CEO 每 2 周過問一次技術進展。
而對于百度來説,這波 AGI 熱潮,可是自己從 2016 年就預言來臨的 AI 時代,自然也不會錯過。
今年 2 月 7 号在内部正式立項,3 月 16 号正式發布。這期間直接上升到百度集團優先級最高的項目, 李彥宏親自督戰,CTO 王海峰博士直接挂帥,那時候百度陽泉超算中心就專門為大模型訓練。
百度算法工程師趙輝告訴 AI 鲸選社,百度自然語言處理部一直就在研究 NLP 等技術,首席科學家吳華也一直是領導,這個部門就有幾百人。百度的 ERNIE2.0 後轉成文心大模型," 以前就在做百度大腦,現在都説是大模型文心麼。"
做的事情有相似,當然也有區别。趙輝提到,以前百度會做很多垂直搜索的 Rank,就是為了根據人為的點擊,重新排序搜索的結果。大模型出現後,這些能力都會被沉澱在大模型的算法中,也有利于給出的回答更精準。
對于百度來説,大模型推動下一代搜索質變,已經寫進了李彥宏的 OKR。不過,對于生态來説,百度的文心大模型是基于 bert 模式," 包括智源的 GLM 都是獨立的技術路線,和國際的 GPT 并不一樣。" 一位百度雲的人員告訴 AI 鲸選社,這點其實倒也不用擔心,文心千帆什麼類型的模型都有,GPT2、3、4 也非常不同。
而説回從阿裏離職的楊紅霞, 她在去往海外後,也被字節跳動挖去做北美大模型的研發負責人。張一鳴一直在研究大模型會開源還是閉源,所以也沒要求集中力量趕工。" 年底前會有真正意義上的突破。" 楊紅霞對 AI 鲸選社説道。
綜合來看,字節跳動應該是繼百度之後,在業務上與大模型更匹配的公司。有獵頭告訴我們,雖然大模型不着急,但在 AIGC 領網域還是挺激進。比如 TikTok 在做廣告創意業務 AIGC,總監職務給出預算 100~150W,要求是 88 後帶隊。
至此,互聯網大廠除了拼多多,已經全部入局大模型。大廠入局的熱情,甚至比當年的 O2O 和直播還有過之而無不及。
三、分水嶺突然出現的那一夜
6 月份,在北京搜狐大廈,光年之外這家融資最多的大模型企業,正熱火朝天地創業。
原一流科技的 Oneflow 深度學習框架還尋思繼續做,但被大模型業務抽調了很多人。可就在 6 月 23 日,突然有人在社交媒體上透露王慧文病了,當時公司還有人去求證,得到的是沒有這回事的消息。可是在 25 日晚,美團突然宣布聯合創始人王慧文因為抑郁症住院,辭去公司董事一事,其創業的光年之外公司面臨出手的新聞。
一時間,光年之外做不下去,王慧文提前跑路的新聞,成為一些人的猜測。AI 鲸選社從投資人圈得到的消息,是王慧文的病情确實很嚴重。最後王慧文睡在上鋪的兄弟,美團創始人王興幫助接盤了光年之外。
大模型真的不行了嗎?大家萌生出此疑問。那期間,正好知名投資人朱嘯虎和獵豹創始人傅盛也在朋友圈争論,大模型行業是否有泡沫。朱嘯虎極度看衰市場一擁而上,做通用大模型的現狀,認為絕大多數都會在年底死掉。
光年之外的主動變動,也是否印證了朱嘯虎的言論?
從 AI 鲸選社獲得信息看,收購了光年之外的美團,目前并沒有停止大模型的腳步。不僅獨家投資了智譜 AI 數億元,當下還在招聘大模型的項目總監,給出的年薪高達 300 萬元,甚至還在美國成立技術研究院。賺辛苦錢的美團,也并不想在這波科技大潮中落後,尤其在餓了麼明确要接入通義大模型,有業務競争的攜程,也已經推出了大模型之後。
但對于國内市場來説,通用大模型确實已經太多。據不完全統計,短短不到 8 個月時間,已經有超過 85 家大模型發布,其中很多成了上市公司的套現概念。
Wind 數據顯示,2023 年 24 家 "AIGC 概念股 " 已經合計發生 67 筆減持,大股東的離婚潮也令人驚嘆。2023 年初至今,近十家 AI 板塊公司大股東家庭被曝離婚。備受關注的是,A 股 AI 企業昆侖萬維,最近就發生占股 11% 的李瓊女士(創始人周亞輝的前妻),計劃減持 3% 的股份(大概 13 億元),然後有息借給公司。據了解内情的人向 AI 鲸選社介紹,感受到了 AGI 紅利的昆侖萬維,不僅做了大模型,最近還在密集組建團隊,全力以赴做對标微軟的 Copilot。
上市公司利用 AGI 抓緊炒概念,套現離場。大模型創業公司則在内卷到死。
一位在近期成立了 AIGC 基金的投資人張陽告訴我們,伴随着開源免費且強大的 Llama 2 襲來之際,下半年很多大模型企業勢必會面臨融資難的問題。
如今一切已經有端倪,在 7 月 11 日,百川智能推出了百億級别參數的大模型 Baichuan-13B,不僅宣布開源,同樣還是免費可商用。雖然 Baichuan-13B 的參數規模不大,但是基于精準的中文語料訓練,在百億規模參數的大模型中,百川經常排名頭部。
Baichuan-13B 的免費策略,大大衝擊了國内大模型付費行情。目前,智源 AI 就在 14 日宣布,企業登記獲得授權,允許免費商業使用 ChatGLM-6B 和 ChatGLM2-6B。
越來越多的大模型開源免費後,大模型的死亡淘汰賽正式開啓。一位基于大模型創業公司的 CTO 對 AI 鲸選社表示,智源的大模型從最開始的私網域部署要 2000 萬元,到年初的調用價格為 180 萬到 30 萬選包,再到現在的免費,行業變化非常之快。傅盛認為這是市場從大模型參數之争,進入生态規模之争。
互聯網大廠并不愁生态建設,由于内部模型非常多,也有免費和付費之分,最主要的大模型目前還是閉源和付費形态。創業公司要建立生态就比較困難,很多初創企業做大模型已花光了力氣,做生态就難免力有不逮。據了解目前 MiniMax 是創業公司中,為數不多堅持公有雲,做 MaaS 模式的大模型企業。
丁香園 CTO 範凱形容這波開源免費潮,就像把自來水廠(大模型)免費接到用户家裏,讓每家人手一個水龍頭,那些閉源的自來水廠,最好你的水無敵好喝,大家才願意付費去你那。
四、AGI 發展進入分岔路口
分水嶺出現後,當下創業競争已經發展了三派。
一派是堅持全自研大模型,都是實力選手。這一派主要是百度、阿裏、字節等互聯網大廠以及智譜、MiniMAX、銜遠等創業企業。但這些實力選手也被劃抽成兩類企業。
第一類是堅持做自研的通用大模型,對标 ChatGPT,不斷追趕 ChatGPT 的迭代速度。
在雲啓資本董事合夥人陳昱看來,通用大模型是必經之路,垂直大模型發展受限。" 因為對于通用大模型而言,垂直領網域并不需要重新訓練,通用大模型可以通過向量數據庫做行業深化,垂直大模型卻很難智能湧現。"
從目前看,有夢想的肯定還要做通用大模型,畢竟做成了可以成為下一個互聯網大廠。ChatGPT 在協同辦公、電商、代碼生成、輔助設計等領網域已經展現出了這種颠覆性潛質。
第二類是認清現實聚焦落地,堅持做垂直大模型,這一派包括最後達成觀點統一的朱嘯虎和傅盛,二者都認為垂直大模型将更有產業适用性。
通用大模型一般是在千億參數以上,而垂直大模型則在百億或者 70 億規模左右。達觀數據的大模型產品曹植,參數就都在 500 億規模之間。
據達觀數據的 CEO 陳運文告訴 AI 鲸選社," 曹植 " 大模型采用混合訓練數據方案,分别是 50% 的通用混合語料 +50% 垂直專業語料。" 我們在金融、政務等領網域做文本智能很多年,很多數據是獨有的,客户也要求我們做私有化訓練。" 陳運文告訴 AI 鲸選社," 以前四五個人用一個星期做一份報告,現在 AI 半天做好了。"
放棄成為下一個 ChatGPT 的夢想,才能在商業場景中盡早落地,這是很多垂直大模型的清醒認知。
在行業看來,通往 AGI 聖殿的第二條路線,是基于别人的模型(如 GPT),然後結合自己的行業 Know-how 去做訓練。" 對于第二類能不能成功,我覺得需要時間去驗證,現在還不明确。原因在于大家還不知道如何把行業 Know-how 去和大模型做融合的有效路徑,如何在有護城河的同時又有可持續的商業模式,這仍是個未知數。"
" 尤其很多大模型,本身就有套殼的嫌疑," 投資人張陽告訴 AI 鲸選社,結合行業做商業化的時候,就會面臨很多問題。據悉,兩個知名同姓創業者的大模型,是基于 Faceboook 的開源 Llama;某遊戲和防護公司用的是智源大模型的基礎框架。
更強的開源大模型正在來襲,Meta 近期發布免費可商用版本 Llama 2,傅盛對此就在朋友圈表示:" 這一下不知道多少公司笑醒在深夜,多少公司哭暈在廁所… ." 朱嘯虎對此也評論道:很多人要笑醒了吧,大家都可以 Take free ride(搭便車)了。
傅盛的 " 笑醒 " 所指,和朱嘯虎略有不同。傅盛笑醒指的是使用開源大模型開發 AIGC 應用的企業,也能做出更好的產品,朱嘯虎笑醒是指那些号稱自研實則套殼的大模型企業,最近也要宣布更新了。大家所指的哭暈内容相同,都是那些号稱自研的大模型企業,國外大模型最強之一 Llama 2 宣布開源免費,大家都基于相同的開源大模型,怎麼在行業中做出特色能力?
AGI 的第三條路線是純粹做應用,是将模型拿來直接使用,這種的壁壘會較低。朱嘯虎也不看好這類模式,認為如果 90% 的能力是 ChatGPT 提供,那麼 AIGC 應用就沒有什麼投資價值。
在 OpenAI 的生态中,山姆 · 奧特曼承諾盡量避免做應用層,和生态開發者競争,因此效仿 Google 做了 ChatGPT Plugin,從目前看,國内還沒有誰做出這種承諾。
文心一言和通義千問,已經有了上百個功能更新,這些功能也覆蓋了一些開發者的工作。雖然文心一言也有插件,但目前就兩個,一個是百度搜索,另一個是 ChatFile(長文檔的分析處理能力)。百度千帆和阿裏魔搭的生态發展如何協調,還是個有挑戰的命題工作。
堅定看好 AGI 的朱嘯虎,認為通用大模型的創業和投資視窗期已過,不絕對依賴某家大模型能力的 AIGC,才是 AGI 時代低垂的果實。比如,近期朋友圈突然蹿火的 " 妙鴨相機 ",算是國内 AIGC 第一個爆火的產品,國外也曾火過類似的產品 "lensa",月收入曾達到 800 萬美元。
時代的浪潮襲來之際,投資人吳世春就曾打趣問道朱嘯虎:" 投 AI 賺的錢把投 SaaS 虧的錢,彌補回來了嗎?" 朱嘯虎回答,還沒,但是 AI 的前景無限。
目前,創投圈也都認可朱嘯虎表達的道理,但很多人并不期待朱嘯虎説出實話,諸如 "ChatGPT 對創業公司很不友好,未來兩三年内請大家放棄融資幻想 " 這些帶有寒意的話。
" 大模型就是互聯網的房地產,就算有泡沫也是美麗的泡沫,"一位剛下場做 AI 職業教育培訓的創業者説道,雷軍曾在 2013 年互聯網紅利消失之際疾呼,要相信互聯網的力量,今天我們也要相信 AGI,無論它有沒有泡沫。
注:本文中李明、張聰、趙輝等為化名。