今天小編分享的互聯網經驗:“卷”資金搶人才,一文看懂國產AI大模型競争格局,歡迎閲讀。
钛度圖聞 · 第一百零三期
策劃制作|钛媒體視覺中心,編輯|劉亞寧,作圖|初彥墨
6 月 29 日,美團在港交所發布公告,宣布收購王慧文創辦的大模型公司 " 光年之外 ",這也給 AI 大模型市場留下了猜測。不只在國内,ChatGPT 的訪問量在近期增速下滑,數據顯示,ChatGPT6 月份的全球訪問量環比降幅 9.7%,獨立訪客數量環比下滑了 5.7%。此外,用户使用 ChatGPT 的時長也在下降,5 月份的每次訪問時長下降了 8.5%,AIGC 似乎迎來了冷靜期。
但另一方面,7 月 4 日,李開復親自籌組的大模型公司 " 零一造物 " 正式上線、百度開發的大語言模型 " 文心一言 "APP 上架蘋果應用市場、企查查發布商查大模型—— " 知彼阿爾法 "...... 各家公司在大模型領網域動作頻頻,熱火朝天。
AI 大模型的創業有多火?資本市場對于這一風口的投資布局如何?如今的國產大模型表現如何?本期钛媒體 · 钛度圖聞試圖從數據層面梳理目前國產大模型的發展現狀。
國内 AI 大模型 " 神仙打架 ",科技巨頭競相出手
從今年 3 月開始,國内的 AI 大模型如雨後春筍般湧現。《中國人工智能大模型地圖研究報告》顯示,截至 2023 年 5 月底,國内 10 億級參數規模以上基礎大模型至少已發布 79 個。
從全球來看,美國在大模型數量方面居全球之首,早在 2020 年,美國就已推出了 15 款大模型,其中包括 GPT-3。而中國從 2020 年開始,大模型也進入高速發展階段,2021 年推出了 30 款大模型,2022 年推出了 28 款大模型,2023 年前 5 個月推出了 19 款大模型,超過美國的 18 款大模型。如今,中美兩國大模型的數量占全球大模型數量的近 90%,中國大模型數量已進入第一梯隊。
國内大模型賽道熱鬧非凡,涉足 AI 大模型賽道的 " 玩家 " 有以阿裏、騰訊、百度等為代表的互聯網大廠,3 月 16 日,百度領跑,推出中國版 ChatGPT" 文心一言 ",随後,阿裏、華為、騰訊、360 等大模型陸續浮出水面。
此外,還有以商湯科技、科大訊飛等為代表的 AI 科技公司和教育類企業孩子王、金融類企業同花順、房地產類企業我愛我家等為代表的各行業公司。另外,大模型在學術界也很火熱,早在今年 2 月,復旦大學就已發布國内首個類 ChatGPT 模型 MOSS。
值得注意的是,随着 ChatGPT 的火爆,國内還火速興起了 AI 大模型的創業風潮,諸多科技大佬以及大廠高管等投身大模型,開啓再創業。2023 年 2 月,原美團聯合創始人王慧文發布 "AI 英雄榜 ",高調入局 AI 大模型;同樣高調入場的還有創新工場 CEO 李開復,3 月 19 日,李開復在朋友圈宣布成立 Project AI 2.0 公司,進軍 AI 大模型;随後,搜狗創始人王小川、前京東 AI 業務開路人周伯文、出門問問 CEO 李志飛等也都加入了 AI 大模型創業熱潮。
除了這些科技大佬,很多互聯網大廠高管也加入競争。比如,快手前 AI 核心人物李岩,成立了 AI 公司元石科技,進行多模态大模型的研發;李開復的 " 關門弟子 "、依圖科技 10 号員工周健成立了瀾碼科技,致力于重塑人機互動的模型。如今,國内 AI 大模型 " 神仙打架 ",行業賽道十分熱鬧。
投資機構出手謹慎,市場高薪招聘大模型領網域人才
入局大模型,首先要備好錢,畢竟大模型創業公司發布一個較為成熟的模型,需要投入大語言模型基礎設施、訓練和研發人才的成本。對于初創企業來説,融到錢才能活下去。
據钛媒體 · 钛度圖聞不完全統計,截至 2023 年 7 月 4 日,今年獲得融資的 AI 大模型創業公司融資金額普遍在千萬到數億元之間。其中,獲得融資金額最多的是大模型初創公司 MiniMax,其在 6 月 1 日完成了超 2.5 億美元的新一輪融資,目前該公司估值超 12 億美元,被冠以 " 騰訊首次投資的創企 " 稱号。此外,剛剛被美團收購的光年之外在 6 月 5 日完成 A 輪 2.3 億美元融資,只不過在美團出手收購完成後,此輪融資也已被悉數退回。值得一提的是,成立于 2021 年的西湖心辰分别在今年 3 月、4 月接連完成了兩筆融資,融資速度很快。
而在 AI 大模型投資中,IDG 資本、經緯創投、真格基金等頭部 VC 的出手較少。據钛媒體 · 钛度圖聞不完全統計,騰訊投資、創新工場、奇績創壇、紅杉中國是較活躍的投資機構,投資企業均達到 3 家,其次是 BV 百度風投和智譜 AI,投資企業分别為 2 家,大多數機構投資的企業僅為 1 家,而一向活躍的高瓴創投、深創投沒有公開數據顯示其進行過 AI 大模型賽道的投資,可見投資人對大模型創業這一賽道出手較為謹慎。
除了融資以外,技術能力也是影響大模型競争的核心。大模型對于算法、算力和數據都有很高的要求,AI 大模型需要高昂的訓練費用和研發投入,一些互聯網大廠和科技公司擁有更為深厚的資金和技術儲備。據钛媒體 · 钛度圖聞不完全統計,2022 年,華為在研發費用上投入 1615 億元,成為研發投資資金最多的企業;其次,騰訊以 614 億元排名第二,阿裏以 555 億元排名第三。互聯網大廠每年研發投入資金就高達百億元,另外還擁有實力雄厚的研發團隊,在大模型賽道上是當之無愧的 " 第一梯隊 " 玩家。
除了資金和技術,人才也是大模型競争中不可或缺的一環。在今年第一季度,各家公司對頂級 AI 人才展開了搶人大戰。王慧文表示要拿出 75% 的股份邀請頂級研發人才,李開復喊話在全球範圍内招募世界級人才,百度以 25-40k/ 月薪資招聘 AI 大模型算法工程師、20-40k/ 月薪資招聘模型構架工程師;阿裏以 40-70k/ 月薪資招聘大模型訓練及算法工程師,各大公司求賢若渴。
相關數據顯示,今年一季度 AI 大模型相關職位的發布量同比增長 10.16%,是與 ChatGPT 相關增長最多的領網域,其中機器學習和算法工程師兩個職位的招聘年薪中位數均達到 40 萬元以上。
國產大模型發展挑戰仍存,部分領網域表現優于國際模型
過去半年,大模型陸續發布,它們目前實力如何?據相關機構對國内外 10 款 AI 大模型的測評,整體來看 ChatGPT 領先優勢較為明顯,綜合數據位居第一。分板塊來看,國内大模型在詞句理解和知識題方面超越國外模型,即國產 AI 大模型對⽂字的基礎認知和學習能⼒較強。
而在 6 個國產大模型中," 文心一言 " 的綜合數據表現較為優異,尤其是在詞句理解、編程、知識題以及翻譯方面領跑國產大語言模型;在商務寫作方面,國内產品表現最好的為 " 訊⻜星⽕ ";在文學題方面,國内產品 " 天⼯ 3.5" 得分率最高,為 88.33%,與 ChatGPT 得分持平;在邏輯推理方面," 文心一言 " 和 " 訊飛星火 " 表現相當。
國内大模型在一些細分領網域其表現是十分優異的,但與國外同類型產品還存在一定差距,在數據等核心技術以及落地場景方面還有很大的進步空間。
在數據層面,大模型的發展需要高質量的訓練數據集。目前國内基于中文語義的大模型訓練所需要的中文數據總量不夠,而且質量不高,優質中文大模型訓練語料的稀缺也加大了差距。
在算力層面,按數據中心容量來統計,2022 年在這一領網域領先的公司是谷歌、微軟、亞馬遜和 Meta,這四個數據中心平台占全球自建數據中心總容量的 7 成以上;而目前國内雖已有像阿裏、百度、騰訊等的一些頭部科技企業完成數據中心建設,但在容量上和國外相比還有一定的差距。
在落地場景方面,不同細分場景落地的成本也是個問題。要想得到一個足夠有效且好用的大模型,需要投入足夠多且有針對性的語料,這意味着不同細分場景的落地需要大量的成本投入。據估算,大模型訓練一次的成本介于 200 萬美元 -1200 萬美元之間。由于訓練成本過高,人工智能開發公司 Open AI 2022 年虧損達到 5.4 億美元左右。所以 AI 大模型的商業變現還需要時間。
在這個競争激烈的賽道上,即使困難重重,國内大模型都在朝着更完善的技術方向走去。而且賽道内的競争也将加速國產大模型技術的發展步伐,推動中國 AI 產業的整體技術更新。
數據來源:Structure Research、InfoQ 研究中心、獵聘大數據、《中國人工智能大模型地圖研究報告》等公開資料不完全整理。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App