大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了

2024-09-20 简体 HK SG TW

今天小编分享的科学经验:新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了,欢迎阅读。

阿里开源,又拿第一了。

这次是在多模态领網域:

就在刚刚,阿里国际 AI 团队开源多模态大模型Ovis1.6。在多模态权威综合评测基准 OpenCompass 上,Ovis1.6-Gemma2-9B 版本综合得分超越 Qwen2VL-7B、InternVL2-26B 和 MiniCPM-V-2.6 等主流开源模型,在 300 亿以下参数开源模型中位居第一。

在数学推理和视觉理解等多项任务中,得分甚至超过了闭源的 GPT-4o-mini。

具体来说,Ovis1.6 能胜任视觉感知推理、数学和科学、生活场景等多种多模态任务。

拿大家伙儿都很关注的数理能力举个,Ovis1.6 的表现是酱婶的:

妈妈再也不用担心我学不明白大学数学。

用来辅助读读论文:

分析财报,效果也相当不错。

还能当场看图教你做一道经典的炸鱼薯条(手动狗头)。

值得一提的是,阿里国际的 Ovis 系列多模态大模型,遵循的是 Apache 2.0 开源協定。也就是说,協定很宽松,商用很友好。

从结构上对齐视觉和文本嵌入

话不多说,我们照例来拆解一下 Ovis 这个新科第一背后的技术细节。

根据 OpenCompass 评测基准,Ovis1.6-Gemma2-9B 超过了 Qwen2-VL-7B、MiniCPM-V-2.6 等一众相同参数量级的知名多模态模型。

在数学等推理任务中,甚至有媲美 70B 参数模型的表现。

Ovis1.6 的幻觉现象和错误率也低于同级别模型,展现了更高的文本质量和准确率。

如何做到?阿里国际 AI 团队的核心思路是:从结构上对齐视觉和文本嵌入。

当前,多数开源多模态大语言模型(MLLM)并非从头训练整个模型,而是通过像多层感知机(MLP)这样的连接器,将预训练的大语言模型(LLM)和视觉 Transformer 集成起来,给 LLM 装上 " 眼睛 "。

这样一来,就导致了一个问题:MLLM 的文本和视觉模块采用不同的嵌入策略,使得视觉和文本信息没办法无缝融合,限制了模型性能的进一步提升。

针对这个问题,Ovis 采用了视觉 tokenizer+ 视觉嵌入表 + 大语言模型的架构。

Ovis 借鉴了大语言模型中的文本嵌入策略,引入了可学习的视觉嵌入表,将连续的视觉特征先转换为概率化的视觉 token,再经由视觉嵌入表多次索引加权得到结构化的视觉嵌入。

文本方面,Ovis 沿用当前大语言模型的处理方式,文本 tokenizer 将输入文本转化为 one-hot token,并根据文本嵌入表查找到每个文本 token 对应的嵌入向量。

最后,Ovis 将所有视觉嵌入向量与文本嵌入向量拼接起来,经由 Transformer 处理,完成多模态任务。

此次开源的 Ovis1.6,相较于前代 Ovis1.5,还在架构、数据、训练策略等方面做出了进一步优化。

架构方面,采用动态子图方案,能灵活应对不同分辨率影像特征,提升了模型处理复杂视觉任务的能力。

数据方面,Ovis1.6 在训练中涵盖了多种类型的数据集,包括 Caption、OCR、Table、Chart、Math 等,确保模型在广泛的应用场景中都有出色表现。

训练策略方面,采用 DPO 等方案持续优化模型性能,增强了模型在生成文本和理解复杂指令方面的能力,使得模型在复杂任务上的表现进一步提升。

消融实验的结果还显示,在训练数据、模型参数、LLM 和视觉底座都保持相同的情况下,与基于 MLP 连接器的多模态大模型架构相比,Ovis 性能整体提升了 8.8%。

量子位还了解到,作为一项基础研究,Ovis 目前已经被广泛应用到了阿里国际的实际业务中。

AI 能力变革出海电商

正如大家所知,阿里国际是一家 AI 驱动的、拥有多个全球知名电商的公司。

而事实上,出海电商这个场景,早已第一批被 AIGC" 渗透 "。

原因很直接:做出海生意,往往面临海外市场复杂、成本和竞争压力大、跨境人才短缺等等共性问题,而多模态大模型这样的 AIGC 技术,恰恰能在这些问题上,提供适配的降本增效方案。

举个例子,在跨境电商领網域,退货退款一直是影响用户体验的重要因素。

传统方案是人工进行退款退货的审核和判责。这不仅需要大量审核人力和较久的审核时间,还会因为人工主观的评判标准不一,导致判罚的不稳定性较高。多数平台为了保证用户体验,倾向于给消费者更多的倾斜,但这也伤害了部分商家和平台的权益。

现在,基于 Ovis,阿里国际融合过去积累的大量电商知识,上线了智能退款系统。

相比于人工,Ovis 针对用户提供的退货退款图文和视频详情,可以提供秒级的审核服务,且具有高度稳定的一致性。这就在保证消费者和商家公平权益的同时,实现了快速低成本的退货退款方案。

另外,在商品属性提取、生成卖点等场景中,Ovis 也已落地应用。

阿里国际 AI 团队,正是在如此预判下成立试跑的。而就在成立这一年多时间里,阿里国际已经实现 AI 能力在跨境电商领網域的规模化应用:

AI 发布商品达到百万规模,并且通过 AI 优化,这些产品在海外的搜索量提升了 37%。

AI 能力覆盖营销、客户服务、商品发布、设计、合规等 40+ 应用场景,服务全球 50 万商家。

阿里国际 AI 能力日均超 5 千万次调用,规模每两月翻番。

……

Ovis 之外,阿里国际还构建了多语言增强大模型 Marco,电商版多模态大模型 MarcoVL,提供的 MaaS 服务包括:

多语言文本生成技术:为商品详情描述适配当地语言,让 AI 为商品介绍改写优化多语言标题,突破语言和文化壁垒。

AI 图片处理,比如一键生成多张虚拟试衣效果。

以及智能消除、智能抠图等影像设计类能力。

可以说,从创立店铺到市场营销,再到售前售后,在出海电商的各个环节,阿里国际都已提供相应的 AI 技术予以辅助——

潜移默化中,AI 已经完全改变商家的工作方式和生产效率。

△店铺设计来自 AI

大模型之所以能在各行各业掀起惊涛骇浪,核心原因就是对生产力的解放和降本增效。

在这一波变革之中,对于阿里国际这样的平台而言,AI 技术能力再次成为最受关注的核心竞争力。

而借助平台之力,出海电商商家已经开始第一批享受拥抱 AI 的红利。

对于广大开发者而言,来自于实干家们的开源贡献,亦是福音。

Ovis1.6 开源地址和 Demo:

arXiv:   https://arxiv.org/abs/2405.20797

Github:   https://github.com/AIDC-AI/Ovis

Huggingface:https://huggingface.co/AIDC-AI/Ovis1.6-Gemma2-9B

Demo:https://huggingface.co/spaces/AIDC-AI/Ovis1.6-Gemma2-9B

—  完  —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們