今天小编分享的科技经验:阿里国际发布最新版多模态大模型Ovis,欢迎阅读。
36 氪获悉,阿里国际 AI 团队宣布发布多模态大模型 Ovis。据介绍,Ovis 能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如,Ovis 可以准确回答数学问题,识别花的品种,支持多种语言的文本提取,甚至可以识别手写字体和复杂的数学公式。Ovis 1.0、1.5 的数据、模型、训练和推理代码都已全部开源,可复现。Ovis1.6 系列中的 Ovis1.6-Gemma2-9B 也已开源权重。