今天小編分享的财經經驗:王小川還是不甘心,歡迎閲讀。
過去一年,一些企業家在激烈競争中積極應變,帶領企業穿越重重風浪,展現出了卓越的韌性和領導力。在龍年春節期間,「市界」特别推出 " 這一年 " 專題,探尋諸多企業家驚心動魄的商業故事,希望為大家提供一些寶貴的經驗和啓示。
作者 | 楊 潔
編輯 | 孫春芳
運營 | 劉 珊
搜狗創始人王小川,攜舊部在 2023 年高調 " 卷土重來 "。
一年過後,背負着年底前 " 做出國内最好的大模型 " 的 KPI,王小川交了一份初期答卷。
2024 年春節期間,王小川發布了自己的龍年願景,他表示:" 與互聯網時代的應用相比,大模型時代的應用将是一個新物種。以前我們更多的是造工具,但現在,我們造的新物種,更像一個人類的夥伴,人類對夥伴的要求,不會要求它像工具一樣精确,更希望讓它與人類合作。"
▲(王小川)
2024 年 1 月 29 日,王小川創辦的大模型公司百川智能,發布了超千億參數的大語言模型 Baichuan 3。百川方面強調,在多個權威通用能力評測中,Baichuan 3 都展現了出色的能力,尤其在中文任務上更是超越了 GPT-4。
百川智能也在一年之間估值就超 10 億美元,成為國内估值增長最快的大模型創業之一。對王小川來説,當初因搜狗賣身騰訊,而沒能做成的事終于在這裏得到了延續。
王小川 " 不甘心 "。正如他在創辦百川智能時所説:" 搜狗未盡的使命,在機器掌握了語言後終于可以實現了。"
事情還得回到 2023 年 4 月,沉寂兩年的王小川,在位于清華大學東門外十字路口的搜狐網絡大廈,召開了一場媒體見面會,宣布與前搜狗 COO 茹立雲聯合成立大模型創業公司百川智能,并拿到了 5000 萬美元的啓動資金。
搜狐網絡大廈曾是搜狗的大本營,王小川可謂 " 舊地重遊 "。當時,這裏匯聚了 AI 創業的群星,美團聯合創始人王慧文成立的大模型公司——光年之外,辦公地點就選在這裏;估值目前已超百億元的智譜 AI,也在樓裏安營扎寨。巧合的是,這三家公司的管理者,都是師出清華的同門。
正當不少人以為王小川要就此上演 " 歸來記 " 時,他卻笑言 " 不跟他們在這裏卷 ",最終帶隊轉戰到了搜狐對面的大廈,雙方一路之隔。
畢竟,王小川雖然起家于搜狐,但這裏也留下了他的遺憾。現在,他要來完成自己的技術理想了。
在 2023 年 ChatGPT 剛剛變得火熱時,王小川就按捺不住,激動地發了一條朋友圈:"OpenAI 的勝利,是技術理想主義的勝利。"
互聯網圈一直津津樂道的,是當年 " 天才少年 " 王小川在搜狐十幾個月就幹出了搜狗搜索,後來拿出了 " 浏覽器 + 輸入法 + 搜索 " 的 " 三級火箭 " 方法論,并在馬雲、馬化騰、周鴻祎、張朝陽等大佬中遊走,一番合縱連橫,推動搜狗獨立在紐交所上市的故事。
但實際上,王小川一直念茲在茲的是一個基于 AI 的技術夢。
在他看來,搜索引擎的意義重大。它是能夠改變人們互動方式、進而改變互聯網世界的力量。而人工智能和搜索,是天然聯系在一起的,搜索引擎本身就能對海量的數據進行處理和匹配,這就是 AI。
王小川是個執着的人。每次搜狗的發布會,他都在侃侃而談技術。2016 年他就説,搜索的未來是人工智能時代的明珠。那時有人問他搜狗為什麼要轉型做 AI,他當時不好發作,但直到一年後他提起來,還憤憤不平地説,自己聽完 " 一肚子火 "。
2017 年初,搜狗的問答機器人汪仔登上了《一站到底》的舞台。不過這些在綜藝上的宣傳噱頭都是表象,搜狗真正要做的,是想将搜索更新到對話系統、問答系統和翻譯系統。王小川相信,加大投入後,搜狗會推出颠覆性的產品。
2017 年 11 月,搜狗登陸美股,上市當日市值突破 50 億美元。王小川意氣風發,他在内部信裏説,接下來 " 唯一的懸念是搜狗能否在搜索領網域實現颠覆,能否在人工智能領網域引領重大的創新 "。
但接下來的四年,搜狗并沒能講出一個激動人心的 AI 故事。歸根結底,無論是搜索還是 AI,都需要極大的投入,但當時的搜狗," 三級火箭 " 的流量紅利已經吃得差不多了,從 2018 年之後公司營收增長開始放緩,增長率從 2017 年的 38% 下降至 2019 年的 4%,在 2020 年營收更是首次出現同比下滑。
與此同時,門户網站的光輝時期已過,處于艱難求生境地的搜狐,自然也無法給予搜狗資金支持。
搜狐創始人張朝陽動起了賣掉搜狗的心思。2013 年投資了搜狗的騰訊,也在 2020 年提出全資收購搜狗。思考了 380 多天後,王小川忍痛放手,在 2021 年 10 月 15 日宣布卸任搜狗 CEO。
這對搜狗獲取騰訊流量是件好事。但對于王小川當初的技術理想來説,卻未嘗不是一種失敗。他離開搜狐,也拒絕加入騰訊,獨歸江湖。
轉捩點在 2023 年來臨。王小川在媒體報道中表示,他在 2023 年 1 月用了 ChatGPT 之後,突然感覺到 " 變天了 "。這種大語言模型能夠用最自然的方法,根據提問作出回答," 不得了,通用人工智能時代已經到來了。"
當年的搜狗為了問答,也做了百億參數模型,但即便使上了十八般武藝,也沒能實現今天大模型的效果。一旦有了大模型的加持,在搜索增強方面,将大有所為。
王小川回憶,當時就有身邊的朋友對他説," 你特别适合做大模型 "。因為,這正好需要用到搜索、輸入法等相關的 AI 能力。
這話對王小川來説,也不知是激勵還是辛酸。王小川説,當時他回想了一下,自己過去幹了 20 多年搜索,卻從來沒人和他説過:" 小川,你适合做搜索。"
于是,王小川重出江湖,要實現他的 AI" 初心 ",彌補搜狗的遺憾。
百川智能旗下,重新聚集的就是原來 " 搜狗系 " 人馬。除了茹立雲之外,前搜狗 CMO 洪濤、前搜狗搜索總經理陳炜鵬也已回歸。當初在搜狗時,王小川和茹立雲、洪濤、前搜狗 CTO 楊洪濤曾并稱為 " 四大天王 ",現在,其中的三位已經再度聚首。
截至去年 10 月,百川智能員工已超 170 人,公司技術聯合創始人陳炜鵬曾表示,搜狗之前各個業務線最優秀的幹将如今已基本集結完畢。王小川也説,搜狗老班底互相之間有信任,會更優先歸隊。
在大模型如何發揮價值上,王小川也再度強調了 " 搜索 ",他提出 " 搜索增強 " 的解決方案。搜索增強可以将大模型的能力與搜索引擎相結合,給大模型 " 投喂 " 更精準、更深入的搜索結果,有助于減少錯誤答案,即所謂的 " 幻覺 " 現象。
" 從國内來看,搜索增強是大模型走向實用的第一步,甚至是最關鍵的一步,沒有搜索增強的大模型在企業裏是沒法落地的。" 王小川在新年願景裏,也再次強調了這一點。
" 我最動心的是,能和一群有理想的人,用極致的技術驅動創造出颠覆性的智能產品。" 在百川智能成立時的公開信中,王小川如是寫道。
眾所周知,王小川和百度董事長、CEO 李彥宏一直 " 不來電 "。創業之後,王小川再度調侃了李彥宏和百度的文心一言,随後百度回嘴説," 王小川脱離一線太久,确實跟我們不在一個宇宙,自然對國内人工智能技術的發展缺乏了解。"
這句話戳中了王小川的 " 痛點 "。第二天凌晨他就發布一條微博怼了回去:" 什麼樣的平行宇宙裏,才能做到讓一個脱離一線 15 年的人,去怼一個脱離一線 1.5 年的人。" 一時間,空氣裏充滿了火藥味。
▲(2005 年,推出搜狗搜索的王小川成為搜狐最年輕的副總裁)
但這确實也是很多人所關注的一點:畢竟,王小川已經離開科技行業一年多了,這段時間裏,他做什麼去了?
王小川其實一直在創業,只不過他的經歷,在不少人眼裏,和人工智能以及大模型,離得有點兒遠。
在離開搜狗時,王小川説,之後将關注生命科學和醫學," 為大眾健康做貢獻 "。
彼時,醫療健康產業正站上風口。在 2020 年時,我國大健康產業規模已經突破 10 萬億元,根據 " 健康中國 " 戰略,到 2030 年產業總規模将達到 16 萬億。然後,他在 2021 年出手投資了腸道醫療技術開發商 " 熱心腸研究院 ";以及專注于口腔人工智能醫療的公司 DeepCare 羽醫甘藍,該公司通過深度學習,推出了口腔影像 AI 分析系統。
從 2021 年到 2022 年,王小川連續注冊了三家名字帶 " 五季 " 的公司,包括北京五季科技有限公司、北京五季健康咨詢有限公司和五季醫學科技有限公司。後來有市場傳聞稱,當時王小川是準備做智能硬體,打造一款治療打鼾的智能枕頭;但在 2023 年初,王小川用了 2 周時間,就做出了決定,放下這個創業項目,去做大模型。
根據天眼查信息,茹立雲也曾在五季醫學科技有限公司持股。去年 9 月,茹立雲退出股東行列,全身心跟随王小川創業。而 " 留守 " 在這家公司的另一位自然人股東,就是搜狗 " 四大天王 " 的最後一位楊洪濤。
從醫療健康到大模型,王小川在創業路上,猛然打了個急轉彎。
作為從互聯網創業時代走過的 " 老兵 ",王小川靈敏地嗅到了 " 技術變革 " 的氣息。過去,從搜索到人工智能,搜狗一直處于百度的下風,王小川也沒有擺脱李彥宏的 " 陰影 "。現在,他終于看到了一次率領團隊、再度挑戰舊秩序的機會,這是他必須抓住的契機。
但之前創業的公司也尚未見眉目,再度轉向人工智能,在外界看來,王小川似乎是一直在追逐風口。
王小川自己并不這麼認為。他在後來接受媒體采訪時表示,自己當年讀研期間做的課題,就是跟基因測序拼接算法相關的。因此,他也好奇 " 如何用數學模型去刻畫生命 ",而人工智能的發展,同樣也是激發了他的想法,想用深度學習的方法去理解生命科學。
盡管有了這一番解釋,但 AI 技術實際上還遠沒有走到如此地步。即使是大語言模型,解決的還是人和機器如何對話的問題。
除此之外,業界最想了解的問題就是:大模型創業 " 前無古人 ",在搜狗之後,王小川這次要怎麼講、以及能不能講好一個全新的 AI 故事?
在創業之初,王小川和其他創業者一樣,都集中在研發通用大模型上。其中的邏輯也很簡單:既然 OpenAI 是這麼起家的,那麼國内也一定要有自己的底座大模型。但大模型賽道已逐漸變得擁擠:到去年 10 月時,國内已湧現了 238 個大模型;自 2023 年 8 月第一批國產大模型通過備案起,截至今年 2 月,已經有 40 餘款大模型獲批對外開放。
" 百模大戰 " 中,百川智能做得究竟怎麼樣?為了打一場和搜狗不同的 " 翻身仗 ",占領先機,王小川帶領百川一路跑得非常 " 急 "。
依靠搜狗時積累的工程能力、王小川的清華技術背景和大佬人脈,百川智能已經成為國内在 2023 年誕生的為數不多大模型 " 獨角獸公司 " 之一。根據去年 10 月百川智能公開的信息,其年内累計融資已達 3.5 億美元。《晚點 LatePost》估計,當前其估值約達 18 億美元。此外的三家估值超 10 億美元的公司分别是通用大模型公司 MiniMax、智譜 AI 和李開復的零一萬物,它們共同成為大模型創企中殺出的 " 黑馬 "。
成立後半年内,百川智能接連發布了 baichuan-7B/13B、Baichuan2-7B/13B 四款開源可免費商用大模型及兩款閉源大模型;平均每 28 天就會發布一款新的大模型。
最引人注目的是,百川智能對 " 引領開源 " 的強調。"Baichuan2-7B 以 70 億參數,在英文評測級上能與 130 億參數的 LLaMA2(Meta AI 正式發布的新一代開源大模型)持平。" 王小川在去年 9 月發布該產品時表示," 我們現在可以獲得比 LLaMA 更友好且能力更強的開源模型,能夠幫助扶持中國整個生态的發展。"
這也直接把國内大模型競争 " 卷 " 向了一個新的高度。越來越多的通用大模型開源,參數也越來越大。去年年中,阿裏雲也加入戰團,成為首家開源的國内大廠。去年 12 月,阿裏雲又宣布開源通義千問 720 億參數模型 Qwen-72B。
但大模型能否如手機的安卓系統一樣,上演一出開源 " 逆襲 " 的故事,還是個未知數。
2023 年 11 月、12 月相對沉寂的百川智能,在今年 1 月底又突然發布了超千億參數大模型 Baichuan 3。超千億參數模型在訓練過程中對高質量數據,訓練穩定性、訓練效率的要求都高出幾個量級,而從 Baichuan 大模型 1.0 的發布到如今 3.0,百川只用了 9 個月時間。王小川給自己的 "KPI" 壓力之大,可見一斑。
王小川在創業時的交流會上,就給公司構建起了初步的目标:年底前預計會發布對标 GPT-3.5 的大模型,并有信心 " 做到國内最好 ",還要做到搜索增強、多模态的增強。
Baichuan 3 顯然目标是全面對标 GPT-3.5、追趕 GPT-4 的。百川智能沒有透露模型參數量,相比之下,GPT-3.5 是 1750 億參數。百川方面表示,在多個權威通用能力評測如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展現了出色的能力;而在 CMMLU、GAOKAO、HumanEval 和 MBPP 等多個中文評測榜單上,更是超越了 GPT-4。
在創業時,王小川曾稱,百川智能将同時發展通用和垂類模型,尤其是在醫療等知識層面重點增強。可以看到,王小川在商業模式上,當時也有了自己的思考,先在具體場景裏做優化、積累行業用户,構建生态,先把模式跑通。在行業選擇上,王小川則是萬變不離其宗,除了搜索老本行,他投資多年的醫療領網域有了用武之地,進入了首選名單。
對于 Baichuan 3,百川方面也強調了其在醫療領網域内的能力。Baichuan3 的醫療數據集 Token 數超千億,醫療能力逼近 GPT-4。在對邏輯推理能力及專業性要求極高的 MCMLE、MedExam、CMExam 等權威醫療評測上的中文效果,Baichuan 3 同樣超過了 GPT-4,是中文醫療任務表現最佳的大模型。
趕在新年前面世的超千億大模型,可以説是王小川和百川智能給自己年初的目标,做的一個 " 年終總結 "。
但這份成績顯然還有待繼續提高。畢竟,目前也沒有一款大模型可以成為公認的 " 國内最好 "。就在不久前的 1 月 16 日,智譜 AI 也發布全國產的新一代基座大模型 GLM-4,整體性能已逼近 GPT-4。最引人注目的是,智譜 AI 還發布了定制化的個人 GLM 大模 GLMs 和 GLMStore,全面對标 OpenAI 的 GPT 商店。
同時,對于大模型,資本的熱情已在漸漸消退。" 下一階段,估計很少有人再會投這種基座大模型了,而是會把注意力放到各行業的應用上去。" 一位投資人告訴「市界」。大模型融資創業的視窗也接近關閉,一位大模型創業者吐槽説,自己一段時間密集見了 30 多家投資機構,卻沒有人出手投資。
資本熱度已經逐漸減退,而大眾感興趣的 " 颠覆時刻 ",似乎還沒有真正意義上到來。通用大模型紛紛開放後,下一步又将 " 卷 " 些什麼?同時,市場也迫切希望,能夠早日看到大模型們清晰的商業化路徑。
市場曾有聲音判斷,2024 年将是 AI 應用迎來爆發。"AI 原生時代,我們需要 100 萬量級的 AI 原生應用,但是不需要 100 個大模型。" 李彥宏也在近期表示。
王小川不止一次在公開場合提到過 " 超級應用 "。他認為,中國的機會或許不是技術科研上比美國跑得快,而是在應用上跑得更快。即 " 理想上慢半步,落地上快一步 "。去年 6 月,他去美國硅谷走了一圈,發現 OpenAI 正在嘗試把 1000 萬顆 GPU 連在一起,訓練一個大規模的模型。回來之後,這句話就被他調整成了 " 理想上慢一步,落地上快三步 ",在產品應用上要跑得更快了。
但百川智能的超級應用仍然 " 在路上 "。2023 年的年底時,王小川在公開活動中還表示,針對 C 端的超級應用,預計會在 2024 年推出," 主要針對健康、快樂、個人助理方向 "。
很多企業也發現,即使 AI 應用出現,大模型時代的應用模式,也和移動互聯網時代不同。這仍是一條需要探索的路徑。像去年火爆一時的妙鴨相機,就跳過了 " 免費獲取早期用户市場 " 階段,在推出的第一天就開始收費,但很快其熱度也下降了。
對于大模型公司來説,現在探讨如何穩定造血還為時過早,目前還是處于卡位戰的階段。而在 " 百模大戰 " 的下半場,淘汰賽也即将開始。
2015 年那波 AI 浪潮中,就誕生過業界公認的 AI" 四小龍 "。後來,四小龍中的商湯科技、雲從科技都已經成功登陸資本市場。但是,以它們為代表的那一代 AI 創企,也普遍都經歷過估值過高之後,商業化變現艱難等問題,很多公司直到現在還在苦惱盈利難題。
經歷過這些的投資人們,面對大模型時出手更為謹慎,更加重視公司實現自我造血的能力。而無論是國内還是海外,大模型技術和產品都還處于探索期,從數據安全、應用場景到商業模式,都充滿着不确定性,所有人都在摸着石頭過河。
王小川這次創業," 押上 " 了自己的名字。他要實現昔日夢想,也要謹慎地避免重蹈覆轍。不過幸好,生成式 AI 大幕才拉開不久,未來舞台還足夠廣闊。
© 市界原創出品,未經授權,請勿轉載