今天小編分享的科學經驗:多模态能力全球TOP3,來自中國從容大模型,歡迎閲讀。
國產多模态大模型的頭号交椅,再次易主——
來自雲從科技的從容大模型,登上 OpenCompass 權威榜單,僅次于 GPT-4o、Claude3.5-Sonnet,位居全球第三。
沒有聽錯,就是AI1.0 四小龍最年輕那個,科創板AI 平台第一股。
國產大模型百花齊放之際,雲從大模型始終顯得低調很多。
結果現在不鳴則已,一鳴驚人,一舉交出這樣一個矚目的答卷。
來看看多模态新擂主的實力如何。
多模态新擂主:從容大模型
來自OpenCompass多模态榜單最新評測結果顯示:
從容大模型在該體系中平均得分為 65.5,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,僅次于 GPT-4o(69.9)和 Claude3.5-Sonnet(67.9),位居全球第三。
而在國内市場,該成績也超過了 InternVL-Chat(61.7)和 GLM-4V(60.8),排名首位。
OpenCompass 大模型開放評測體系是上海 AI Lab 的完整開源可復現的評測框架。
其多模态評測方面采用了 8 個具有代表性的數據集,主打一個全範圍、多視角、客觀量化。
評估維度覆蓋目标檢測、文字識别、動作識别、影像理解和關系推理、藝術與設計、商業、科學、健康與醫學、人文與社會科學、技術與工程、數學推理等多個方面。
結果此次測評中,從容大模型在 6 個數據集上表現優異,位列全國第一,包括 MMBench、MMStar、MathVista、HallusionBench、AI2D、OCRBench。
尤其在 OCRBench 測試集上以取得全球最高的 827 分(總分為 1000 分),且高于第二名 GLM-4v13 分。
這意味着,從容大模型在文本識别、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵信息提取等任務場景下表現優異。
事實上,這也不是從容大模型第一次在全球大模型競技場中霸榜。
在此之前,它已在視覺、跨模态領網域 10 次刷新世界紀錄。綜合性能經第三方 SuperClue、C-Eval 等綜合評測,位列全球前五。
雲從科技視覺大模型在 Benchmark COCO 上,從微軟研究院(MSR)、上海 AI Lab、智源 AI 研究院等多家知名企業與研究機構脱穎而出,刷新了世界紀錄;
去年 11 月,SuperClue 測試集中,從容大模型綜合成績在國内大模型排名第一,僅次于 GPT-4 和 GPT-4 Turbo。
特别是 OPEN 測試模塊中表現搶眼,包括角色扮演、上下文對話、生成創作等多項能力實現 SOTA。
雲從的 AI 大模型布局和落地
新擂主雲從,聲勢低調,但大模型和 AI 進展生猛,動作頻頻。
以從容大模型為代表,來看看雲從在 AI 大模型布局和落地上面交出的是一個什麼樣的答卷。
去年 5 月,行業内千呼萬喚之中,從容大模型終于亮相。當時起步不算晚,但早早釋放出強烈的行業應用信号。
當時除了基座大模型外,雲從還演示了多場景下行業大模型,像政務、金融、制造、教育、遊戲等。
與此同時,發布會現場還建立了行業生态聯盟,與中檢、神州信息、佳都、深圳報業、遊族、今世緣、艾登等多家公司籤約。
同一個月,雲從西部智算中心正式運營,标志着從容大模型生產線正式投產。
有基座模型、有應用生态、有智算中心…種種砝碼加注,可以看到,從容大模型起跑線不低,而且加速度明顯。
這在之後一年多的迭代與落地之中也得以驗證,從容大模型在模型、應用以及生态層面全方位發力。
模型層,從容大模型共迭代兩次,有 1.5 以及 2.0 版本。目前整個從容大模型系列,包含語言、視覺、語音、代碼生成、影像生成等大模型。
其技術能力,頻頻被學術頂會認可。
像雲從聯合上海交大、中山大學等團隊提出一種視覺模型自監督學習方法 PointCMP,僅需過往 1% 的數據量或者無需真實數據便可以達到相同的效果,最終成功被 CVPR 2023 接收。
此外其視覺大模型還在 ICCV2023 細粒度行為檢測挑戰賽斬獲冠軍。
還有像All-in-One 大一統,這個時下最前沿的大模型學術思路,早在去年 8 月,雲從就已經有所嘗試。
他們在多模态領網域唯一 CCF A 類頂級學術會議 ACM MM 上提出視覺 - 語言跟蹤大一統模型 All-in-One,最終在跨模态領網域(TNL2K, LaSOT, LaSOTExt, WebUAV-3M)刷新 4 項世界紀錄。
底座大模型能力持續提升,帶動着行業基礎大模型的迭代更新以及應用落地。
比如在交通領網域,他們的行人基礎大模型在 PA-100K、RAP V2、PETA、HICO-DET 四個數據集上從阿裏巴巴、日立等多家知名高校、企業機構脱穎而出,刷新了世界紀錄。
還有消費領網域,他們的商品基礎大模型在 MUGE、Product1M 兩個規模最大的開源中文多模态商品檢索數據集更是刷新了世界紀錄,同場競技者還包括百度、快手、京東、OPPO 等玩家。
在應用層,過去一年中,他們軟硬體皆有布局,且在金融、安防、政務、交通、能源、教育、醫療、港口、文娛等行業領網域都有落地。
他們推出數字人雲月,除了高度拟人化呈現,它在動作、形象和智力層面都接近真人水平。
而為了更大範圍落地,他們還打造了數字人服務平台,端到端實現造人、育人、用人等一站式構建數字人操作。
在個人辦公領網域,他們推出了智能硬體——
内置大模型的 AI 滑鼠,結合本地個人知識庫,支持語音輸入、PPT 生成、智能問答、智能寫作等功能。
只需一個「AI」鍵,每個人都擁有自己 AI 助手。
關于 AI 大模型的應用和落地,除了自身技術融合,也同樣離不開生态層面的支撐。
他們很早就同華為昇騰合作,推出從容大模型訓推一體機,依托于國產算力,為企業提供從模型訓練到推理應用的一體化解決方案。
解決方案内置了大模型推理引擎、調優工具和算子加速庫,支撐客户開箱即用,無需進行二次硬體活配即可讓客户能夠直接使用大型預訓練模型,從而實現本地化部署。
他們還聯合推出了變電智巡大模型,可替代人類完成對電力設備的自動巡檢,為能源行業的數字化轉型提供了大模型應用範式。
而此前建成的西部智算中心,目前已達到 1200P 算力資源,可以滿足 10 個百億級或 2-5 個千億級基礎大模型同時進行預訓練,以及約 100 個行業大模型同時進行微調訓練。
可以看到,雲從的 " 一鳴驚人 ",并非一日之功,也并非單打獨鬥。
除了自身技術實力以及應用生态優勢,也同他們從一開始「技術認知」不無關系。
從容大模型的幾次迭代,瞄準的都是能快速普及應用的剛需能力,比如多模态能力,以提供更好的互動性能;還有像推理與壓縮大模型參數,更低成本實現更快的部署。
本身就立足于人機協同作業系統的雲從,此次大模型恰好給它帶來了新的靈感和範式。
與此同時,帶來了新的行業問題:
AI 格局、大模型格局,現在距離 " 确定 " 還很遠。
大模型格局,是時候重新審視
行業發展到現在,的确到了重新審視的時候了。
此前,業内将全新大模型創業獨角獸,按照了 " 五虎 "、" 六小強 " 來統稱。
雖然團隊技術風格、戰略路線都不盡相同,但都有個共同點:
他們來勢洶洶,資本押注,迅速閃耀。
有OpenAI這樣一個超強獨角獸在前作為參考,國内資本市場對他們寄予厚望,其關注度自然比以往任何一次技術浪潮更甚,諸多創新公司以對标 OpenAI 出發,從 0 到 1 打造基礎大模型,然後在第一階段競速中脱穎而出,被統稱、被歸類,視為衝擊下一階段 AGI 大目标的種子選手。
新玩家的關注度,始終占據主流。
甚至一度要比巨頭玩家,硅谷的谷歌、Meta,國内的 BAT 華為訊飛,都更被期待。究其原因,無非是市場對于 " 年輕鋭氣 " 的偏愛,以及認定 " 一個時代有一個時代的公司 "。
但即便如此,在 AI 2.0 的浪潮中,卻也有不容忽視的獨特性。
因為 AI 2.0,無非是對生成式 AI、大模型浪潮的一種人為劃分,但 AI 或者深度學習的本質驅動力三要素,始終沒有發生過改變。
依然是:算法、算力和數據。
而且随着 Transformer 成為主流,業内接受其算法範式新潮流的地位,那算法的魔力、帶來的差異性,只會随着時間的流逝而減弱。
算力和數據正在成為新階段競速的關鍵,或者更準确地説,是運用算力和數據的能力。
所以誰是運用算力和數據的能力裏,不容忽視的實力派玩家?
答案可能有很多,但一定有 AI 1.0 裏久經考驗、落地為王中勝出的公司。
他們有深度學習的研發能力,擁有學研和產業落地檢驗後的算力能力,還有時間和規模構建起的數據壁壘。在巨頭玩家和 AI 2.0 初創公司之間,他們是不折不扣的中堅、中流砥柱,絕對不容忽視。
實際上,如此維度的觀測并非只是趨勢指引,而是對已經發生的現象歸納出的總結。
就在大模型浪潮開始後,商湯、曠視、雲從……都迅速給出了屬于新浪潮的成績單,這就是技術源發一脈才能展現的實力。以及還有更具體攪動產業競速的 Token 成本降價大戰," 始作俑者 " 深度求索,實際也是一家 AI 1.0 時代出發的公司。
而且 AI 1.0 裏的赢家,面對接下來的擂台賽,還有更有利的位置和資源。
如果説現在統稱的 AI 新四小龍、五小虎、六小強……都只是對技術實力、估值的概括,那接下來真正考驗能力的,是落地場景和商業化能力。
對于 AI 2.0 公司是新挑戰,對于 AI 1.0 公司則是飛輪之下久經考驗的小 case,甚至他們有成熟的團隊、方案、場景和數據,擁有時間和實踐檢驗的保證。
就像從容大模型剛剛發布時,雲從這樣回答大模型帶給他們的變與不變——
變了嗎?其實沒變,同樣人機協同的立足點,同樣的行業生态夥伴,就是服務客户也基本上是同一批。要説變了嗎,其實也變了。那就是大模型帶來技術範式的新靈感。大量的智能化湧現,讓更多技術實踐中遇到的問題都可以迎刃而解。
現在來看,從容大模型的最新成績,各行業場景的落地,印證了判斷的準确性。
所以歸根結底,大模型帶來的 AI 格局衝擊和重寫,才剛剛開始。
1.0 也好、2.0 也好,都是對階段性發展的概括。四小龍也好、五小虎也罷,都是對一個類型一個橫截面的片面統稱。
如果要更加全局性審視 AI 江湖,按照技術和商業的兩大指标,參考算法、算力和數據的價值潛力……行業概念就需要重新審視了。
比如以從容大模型站上擂台之巅、已經開啓規模化場景產業落地的雲從,是 1.0 時代的龍,也很難説不是 2.0 時代的虎——至少,是時候提出這個問題了。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>