今天小編分享的互聯網經驗:元象首個多模态大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入,歡迎閱讀。
人類獲取的信息 83% 來自視覺,圖文多模态大模型能感知更豐富和精确的真實世界信息,構建更全面的認知智能,從而向 AGI(通用人工智能)邁出更大步伐。
元象今日發布多模态大模型 XVERSE-V ,支持任意寬高比影像輸入,在主流評測中效果領先。該模型全開源,無條件免費商用 ,持續推動海量中小企業、研究者和開發者的研發和應用創新。
XVERSE-V 性能優異,在多項權威多模态評測中超過零一萬物 Yi-VL-34B、面壁智能 OmniLMM-12B 及深度求索 DeepSeek-VL-7B 等開源模型,在綜合能力測評 MMBench 中超過了谷歌 GeminiProVision、阿裡 Qwen-VL-Plus 和 Claude-3V Sonnet 等知名閉源模型。
圖 . 多模态大模型綜合評測
1
融合整體和局部的高清影像表示
傳統的多模态模型的影像表示只有整體,XVERSE-V 創新性地采用了融合整體和局部的策略,支持輸入任意寬高比的影像。兼顧全局的概覽信息和局部的細節信息,能夠識别和分析影像中的細微特征,看的更清楚,理解的更準确。
注:Concate* 表示按列進行拼接
這樣的處理方式使模型可以應用于廣泛的領網域,包括全景圖識别、衛星影像、古文物掃描分析等。
示例 - 高清全景圖識别 、圖片細節文字識别
免費下載大模型
Hugging Face:https://huggingface.co/xverse/XVERSE-V-13B
ModelScope 魔搭:https://modelscope.cn/models/xverse/XVERSE-V-13B
Github:https://github.com/xverse-ai/XVERSE-V-13B
問詢發送:[email protected]
商業合作
微信添加:lixing_lixing
元象持續打造國内開源标杆,在國内最早開源最大參數 65B 、全球最早開源最長上下文 256K 以及 國際前沿的 MoE 模型, 并在 SuperCLUE 測評全國領跑。此次推出 MoE 模型, 填補國產開源空白,更将其 推向了國際領先水 平。
商業應用上,元象大模型是 廣東最早獲得國家備案的模型之一 ,可向全社會提供服務。元象大模型去年起已和多個騰訊產品,包括 QQ 音樂 、虎牙直播、全民 K 歌、騰訊雲等,進行深度合作與應用探索,為文化、娛樂、旅遊、金融領網域打造創新領先的用戶體驗。
2
多方向實際應用表現突出
模型不僅在基礎能力上表現出色,在實際的應用場景中也有着出色的表現。具備不同場景下的理解能力,能夠處理信息圖、文獻、現實場景、數理題目、科學文獻、代碼轉化等不同需求。
圖表理解
不論是復雜圖文結合的信息圖理解,還是單一圖表的分析與計算,模型都能夠自如應對。
視障真實場景
在真實視障場景測試集 VizWiz 中,XVERSE-V 表現出色,超過了 InternVL-Chat-V1.5、DeepSeek-VL-7B 等幾乎所有主流的開源多模态大模型。該測試集包含了來自真實視障用戶提出的超過 31,000 個視覺問答,能準确反映用戶的真實需求與瑣碎細小的問題,幫助視障人群克服他們日常真實的視覺挑戰。
VizWiz 測試示例
看圖内容創作
XVERSE-V 具備多模态能力的同時保持強大的文本生成能力,能夠很好勝任理解影像後創造性文本生成的任務。
教育解題
模型具備了廣泛的知識儲備和邏輯推理能力,能夠識别影像解答不同學科的問題。
百科解答
模型儲備了歷史、文化、科技、安全等各類主題的知識。
代碼撰寫
自動駕駛
情感理解與識别
元象公司介紹
一元復始,萬象更新。元象 XVERSE 于 2021 年初在深圳成立,是國内領先的 AI 與 3D 技術服務公司,致力于打造 AI 驅動的 3D 内容生產與消費一站式平台,願景為 " 定義你的世界 "。
元象創始人姚星是前騰訊副總裁和騰訊 AI Lab 創始人、國家科技部新一代人工智能戰略咨詢委員會成員。元象累計融資金額超過 2 億美元,投資機構包括騰訊、高榕資本、五源資本、高瓴創投、紅杉中國、淡馬錫和 CPE 源峰等。
元象獲國家 " 專精特新 "、" 高新技術企業 " 認證,團隊目前有 75% 為研發人員(60% 為碩博學歷)。公司積極推動前沿技術自主研發,在 3D 領網域,自研行業引領性的 " 端雲協同 " 3D 互動技術,開創零門檻(輕)、一站式(快)、高品質(美)全新 3D 體驗;在 AI 領網域,公司最早開源國内最大參數大模型(650 億)、世界最長上下文長度(256K)在内的一系列高性能大模型,免費可商用,将國產開源提升至國際一流水平,積極推動大模型國產可替代和行業應用發展。
元象已經為多家龍頭企業提供一站式技術與服務,包括:澳門大三巴、南京大報恩寺、央視、騰訊音樂 TMELAND、華為、一汽大眾、阿迪達斯、中國平安、中科院深圳先進院等。
公司注冊名:深圳元象信息科技有限公司
官網:www.XVERSE.cn
官微:元象 XVERSE
Logo 下載
鏈接 : https://pan.baidu.com/s/1fB-zoITVJZ7Znv5IVe-fZg
提取碼 : rav0
雷峰網