今天小编分享的互联网经验:阿里云开源通义千问多模态大模型Qwen-VL,欢迎阅读。
大模型资讯:
阿里云开源通义千问多模态大模型 Qwen-VL
阿里云今天宣布推出开源大规模视觉语言模型 Qwen-VL。Qwen-VL 以通义千问 70 亿参数模型 Qwen-7B 为基座语言模型研发,支持图文输入,具备多模态信息理解能力。
Qwen-VL 是支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的 VL 模型,Qwen-VL 除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、影像中文字理解等能力。
在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL 取得了远超同等规模通用模型的表现。
IBM 将参与 Hugging Face2.35 亿美元 D 轮融资
IBM 和开源人工智能平台 Hugging Face 周四联合宣布,前者参与了后者的 2.35 亿美元的 D 轮融资。
这笔额外的资金将进一步加强 Hugging Face 作为领先的开源和开放科学人工智能平台的地位。IBM 和 Hugging Face 最近宣布在 IBM 的生成式人工智能平台 watsonx 上展开合作,帮助企业构建、部署和定制跨多个领網域的基础模型。
在 watsonx 中,人工智能构建者可以利用 IBM 和 Hugging Face 社区的模型,这些模型经过预先训练,可以支持一系列自然语言处理 ( NLP ) 任务,包括问题回答、内容生成和摘要、文本分类和提取。
AMD 收购 AI 軟體公司 Mipsology,将加强 AMD AI 軟體开发能力
据 AMD 官网显示,AMD 宣布收购 AI 軟體公司 Mipsology。
AMD 表示, Mipsology 的軟體团队将加入 AMD AI Group,帮助进一步加快 AMD 的客户参与度并扩展 AMD 的 AI 軟體开发能力。该团队将帮助开发 AMD 完整的人工智能軟體堆栈,扩展 AMD 的軟體工具、库和模型的开放生态系统,为在 AMD 硬體上运行的人工智能模型的简化部署铺平道路。
Mipsology 成立于 2015 年,总部位于法国帕莱索。该公司主要开发针对 AMD 硬體量身定制的领先 AI 推理、优化解决方案和工具。
微软 Teams 引入 Typeface AI 工具,加强品牌营销内容
微软近日宣布,将为微软 Teams 加入 AI 工具 Typeface 。
据悉, Typeface 整合了 Azure 机器学习、Azure OpenAI 服务和 Typeface 品牌个性化 AI 的强大能力,可以用于创建创意简报、电子邮件营销活动以及多媒体在线广告等内容。用户可以在无须切换应用程式的情况下增强品牌内容。企业可以使用 Affinity AI 模式来训练 Typeface AI 应用程式,创建自己的专属内容。
Meta AI 公布开源基础模型 Code Llama,专攻代码生成
Meta AI 近日发布论文,公布了一款针对代码生成功能的基础大语言模型 Code Llama。
据悉,Code Llama 基于 Llama 2 开发,具有开放式模型中领先的性能、填充能力、对大型输入上下文的支持以及用于编程任务的零指令跟随能力。它提供包括基础模型、Python 专用版本以及指令跟随模型等多个模型,每个模型的参数分别为 7B、13B 和 34B。所有模型都是基于 16k 标记序列进行训练,并在最多 100k 标记输入上显示出改进。
Code Llama 以宽松许可证方式开源,允许研究和商业使用。
奇安信发布 Q-GPT 安全机器人和大模型卫士
奇安信集团在京发布了 Q-GPT(奇安信大模型)安全机器人和大模型卫士。
据介绍,Q-GPT 安全机器人是基于奇安信大模型的 " 虚拟安全专家 ",可以全天候工作。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源等功能为一体。
会上,京东方集团和吉利集团等客户现场签约,成为国内首批 Q-GPT 安全机器人和安全大模型用户。
重点论文:
中国科学技术大学联手新加坡管理大学,推出影像生成模型 CgT-GAN
据 Arxiv 页面显示,中国科学技术大学近日联手新加坡管理大学发布一款影像生成模型 CgT-Gan。
CgT-GAN 通过将影像纳入训练过程,使模型能够 " 看到 " 真实的视觉模态。具体来说,研究团队采用对抗训练来教导 CgT-GAN 模型模仿外部文本语料库的短语,同时利用基于 CLIP 的奖励机制提供语义指导。
实验结果显示,CgT-GAN 在所有指标上明显优于现有的方法。
论文地址:点此前往