今天小編分享的汽車經驗:全球大模型競争更新,中國大模型五虎到位,歡迎閱讀。
作者:松果财經
大模型浪潮的席卷速度,超越了歷史上任何一場技術革命。
年初,OpenAI 發布 Sora,馬斯克、周鴻祎不惜溢美之詞,狂熱蔓延全世界。正當大家還在驚嘆 " 未來已來 ",Anthropic 公司宣布 Claude-3 正式發布,并宣布在 AI 邏輯基準測試中超過了 ChatGPT-4。與此同時,Google 和馬斯克同時跳入開源大戰,分别推出 Gemma 和 Grok。
全球大模型的競争熱潮,從小眾圈層向外擴散,像漣漪一樣,播散向全世界。一場大模型的無限競争就此打響。全球科技巨頭攜帶着大筆充沛的資金、漂亮履歷的技術人才将戰場燒的更加火熱。
但冷靜一看,目前世界上公認的大模型領軍者,大多卻是年輕的 AI 企業:估值高達 290 億美元的 OpenAI,成立于 2015 年;被稱為 OpenAI" 最強競争對手 " 的大模型公司 Anthropic 成立于 2021 年;" 歐洲新秀 "Mistra 創立至今,剛到一年。三家閃耀的 AI 明星公司的員工加起來卻可能不到一千人,只是科技大廠的一個部門的人數。
為什麼這場對大模型王冠的追逐戰,不在巨頭的射程範圍内?
01 為什麼榮光屬于 AI 企業?
首先,打破一個認知誤區:大模型并不是一場單單依靠資源的軍備競賽。
在 ChatGPT 橫空出世後,一個廣為流傳的說法是,OpenAI 成功的關鍵在于背靠微軟 Azure 雲上的數萬張 A100 卡,成本高達數億美元。更有甚者認為大模型的勝率取決于資源的充沛程度。
然而,今年 3 月,美國初創公司 Databricks 突然公布旗下開源大語言模型 DBRX,号稱是全球最強開源大模型,參數規模達到 1320 億,表現更是超越 Meta 的 Llama2、Mistral AI 的 Mixtral,以及馬斯克旗下 xAI 公司剛剛開源的 Grok-1。
更重要的是,他們只花了 2 個月和 1000 萬美元,在性能全面超越 GPT-3.5 的同時,訓練時間和成本都只有 GPT-3.5 的一小部分。
事實上,資源對于任何領網域的競争都很重要,但資源在大模型領網域卻不是萬能的、更不是唯一因素。而 AI 企業相比科技巨頭,有一個得天獨厚的優勢,就在于技術探索上的靈活性。
Google 曾是人工智能深度學習領網域裡當之無愧的王者。2016 年,擊敗人類圍棋冠軍李世石的阿爾法 go 就是出自谷歌 Deepmind,而在自然語言模型領網域,谷歌也曾遙遙領先。
然而,2022 年 ChatGPT 橫空出世。實際上拉開身位差距的是技術路線上的分歧。谷歌追逐的自然語言模型應該是一系列的垂類,參數相對較小、适用場景面相對較窄的模型,而 OpenAI 認為應該做一個通用的海量參數,海量數據訓練的超級大模型。
OpenAI 當年的夢想看來是天方夜譚。但即便在與谷歌的較量中長期落于下風,OpenAI 也沒有放棄将 GPT 作為唯一路線。阿爾特曼的一句話給出了答案—— " 創業公司做什麼都很難,那不如抓住大機會。"(Startups are very hard no matter what you do , you may as well go after a big opportunity.)
相比于 AI 企業的靈活性,科技巨頭在押注技術路線上卻很難如此孤注一擲,這也一定程度上造成了動作的遲緩。這也注定了,AI 的最新方向大概率要靠 AI 企業去探索。
海外 AI 明星公司鱗次栉比、星光璀璨。那麼問題來了,中國領網域的 AI 明星公司在哪?
02 " 中國大模型五虎 " 浮出水面
一張 SuperCLUE 評測榜單揭開了中國大模型五虎的秘密。
刨除 BAT,榜單上展現着中國最強 AI 企業的身影,分别是百川智能、智譜 AI、月之暗面、MiniMax、雲從科技。
百川智能成立于 2023 年 4 月,創始人為前搜狗公司 CEO 王小川。成立後短短數月,百川智能便跻身科技獨角獸行列,成立至今更是連續發布了 11 款基礎大模型。
智譜 AI 成立于 2019 年,今年初已完成新一輪融資。創始人張鵬,畢業于清華大學計算機科學與技術系。幾年來,公司連續發布了 GLM 系列大模型、ChatGLM、CodeGeeX 代碼大模型等,已成為國内最早也是最有大模型研發經驗的企業之一。
MiniMax 成立于 2021 年,背後的掌舵者闫俊傑畢業于中科院自動化所,在商湯科技擔任副總裁期間,負責搭建深度學習的工具鏈和底層算法,以及通用智能的技術發展。聯合創始人楊斌,則是闫俊傑在中科院的校友。
同樣來勢洶洶的還有月之暗面(Moonshot AI)—— 2023 年,月之暗面接連完成兩輪共計近 20 億人民币的融資,估值超 25 億美金。月之暗面成立于 2023 年 3 月由三位清華校友創辦,帶頭人則是 90 後學霸楊植麟。
至此,加上雲從科技,中國 AI 大模型五虎呼之欲出。
雲從科技曾是 "AI 四小龍 " 中 A 股第一股,也是國内 AI 三駕馬車中,唯一一家具備全内資背景的企業。在業内,雲從科技與商湯科技、曠視科技、依圖科技并稱 "AI 四小龍 ",但論起光環與熱度,最年輕的雲從科技,卻是最 " 頂流 " 的存在。
"AI 國家隊選手 "、" 中國科學院孵化企業 "、" 中國 AI 第一梯隊企業 "、" 首個同時承擔國家發展和改革委人工智能基礎平台、應用平台,科技部開放平台等重大項目建設任務、并參與國家及行業标準制定的人工智能企業 " 等稱号,讓雲從科技自 2015 年誕生以來,始終處于行業聚光燈下。
如今,雲從科技又在大模型時代昂首闊步。
03 被時代眷顧的優等生
去年五月,位列國内人工智能第一梯隊的雲從科技,正式發布了 AI 智能體(AI-agent)領網域的戰略級產品—— " 從容多模态大模型 "。
雲從科技研究院產品總監孫進在接受媒體采訪時表示:從容大模型在内部已經歷了多輪迭代。1.5 版本時,平衡上下文長度、模型性能與推理成本是迭代重點。從容大模型 2.0 版本
已經完成,3.0 版本重點是多模态能力 -- 跳過文本直接處理不同模态的數據。
不只是對話體驗,從容大模型還可以編程、寫作、解題等。雲從還對 " 從容 " 與 ChatGPT 進行橫向對比演示,在對同一真題的解答過程中,從容大模型的答題速度相較更快,但推理能力、語義理解能力已超過 GPT 3.5,略低于 GPT4.0。
經第三方機構 SuperClue、C-Eval 等綜合評測,從容大模型綜合性能位列全球前五。同時,從容大模型具備多模态能力,在視覺、跨模态領網域 10 次刷新世界紀錄。
據雲從科技介紹,公司已布局了數十個行業大模型,并研發了 DataGPT、智能客服、AI 滑鼠等多個泛 AI 智能應用,成為雲從科技布局 AI 智能體(AI-agent)的重要抓手。
同時,雲從科技與華為昇騰聯合提出應對智算基礎設施挑戰的解決之道,開啟 " 國產化算力 + 智算 " 的新布局。目前,雙方已合作推出大模型應用底座——從容大模型訓推一體機,并與天津港集團、首鏈科技、今世緣、國網山東、中國電信等合作夥伴一起,成功幫助港口、醫藥、制造、電力、銀行等行業客戶落地生成式 AI 應用場景。
雲從科技連續踏中兩波 AI 浪潮,離不開其深厚的科研背景。
雲從科技的創始人周曦,曾以中科院 " 百人計劃 " 專家身份引進回國,擔任中國科學院重慶綠色智能技術研究院信息所副所長等職位。用了半年時間,他在全國範圍内組建起一支擁有 20 多位專業人才的團隊,并入選中國科學院 A 類戰略性先導科技專項,成為其中唯一的人臉識别團隊。
在日後,這只團隊成為了計算機視覺領網域的國家隊,其技術成果先後被用在多個省份,在 alpha go 尚未大戰李世石讓 AI 一夜爆火之前,就悄然将這一技術帶到了普通人的生活之中。
一直到 2015 年 4 月,33 歲的周曦,卻放棄别人豔羨的 " 鐵飯碗 ",選擇内部創業,牽頭成立雲從科技,專攻人臉識别領網域。
" 很驚訝,因為在這個領網域很少見到願意放棄現有職位全力投入創業的科學家。" 海通證券某人士在接受媒體采訪時表示," 海通作為雲從的第一個項目,在應用實現上有特别多困難,周曦當時把整個研發弄到上海來攻堅了一周,系統上線後到現在再也沒出過問題。"
從 2015 年開始,人臉識别作為計算機視覺領網域最易落地的賽道,開始逐漸形成風口。在筚路藍縷七年之後,雲從交上了他的答卷:作為唯一一家全内資 AI 企業,順利登陸科創板,被稱為 "AI 國家隊 "。
翻開雲從科技的招股書,我們可以看到,雲從科技的創始團隊大多來自中科院、中科大。公司擁有近 600 名科研人員,研發人員占比超過 50%,核心團隊曾先後 10 次獲得國内外人工智能領網域桂冠。
如今全球大模型競争風起雲湧,新的科技浪潮席卷各行各業,中國人工智能領網域在焦慮和追趕中又一次走到了十字路口。
如何書寫這一次新的篇章,既是雲從科技新的課題,同樣也是所有中國 AI 企業迫切的使命。