阿里云开源通义千问多模态大模型Qwen-VL

今天小编分享的互联网经验：阿里云开源通义千问多模态大模型Qwen-VL，欢迎阅读。

大模型资讯：

阿里云开源通义千问多模态大模型 Qwen-VL

阿里云今天宣布推出开源大规模视觉语言模型 Qwen-VL。Qwen-VL 以通义千问 70 亿参数模型 Qwen-7B 为基座语言模型研发，支持图文输入，具备多模态信息理解能力。

Qwen-VL 是支持中英文等多种语言的视觉语言（Vision Language，VL）模型，相较于此前的 VL 模型，Qwen-VL 除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、影像中文字理解等能力。

在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL 取得了远超同等规模通用模型的表现。

IBM 将参与 Hugging Face2.35 亿美元 D 轮融资

IBM 和开源人工智能平台 Hugging Face 周四联合宣布，前者参与了后者的 2.35 亿美元的 D 轮融资。

这笔额外的资金将进一步加强 Hugging Face 作为领先的开源和开放科学人工智能平台的地位。IBM 和 Hugging Face 最近宣布在 IBM 的生成式人工智能平台 watsonx 上展开合作，帮助企业构建、部署和定制跨多个领網域的基础模型。

在 watsonx 中，人工智能构建者可以利用 IBM 和 Hugging Face 社区的模型，这些模型经过预先训练，可以支持一系列自然语言处理 ( NLP ) 任务，包括问题回答、内容生成和摘要、文本分类和提取。

AMD 收购 AI 軟體公司 Mipsology，将加强 AMD AI 軟體开发能力

据 AMD 官网显示，AMD 宣布收购 AI 軟體公司 Mipsology。

AMD 表示， Mipsology 的軟體团队将加入 AMD AI Group，帮助进一步加快 AMD 的客户参与度并扩展 AMD 的 AI 軟體开发能力。该团队将帮助开发 AMD 完整的人工智能軟體堆栈，扩展 AMD 的軟體工具、库和模型的开放生态系统，为在 AMD 硬體上运行的人工智能模型的简化部署铺平道路。

Mipsology 成立于 2015 年，总部位于法国帕莱索。该公司主要开发针对 AMD 硬體量身定制的领先 AI 推理、优化解决方案和工具。

微软 Teams 引入 Typeface AI 工具，加强品牌营销内容

微软近日宣布，将为微软 Teams 加入 AI 工具 Typeface 。

据悉， Typeface 整合了 Azure 机器学习、Azure OpenAI 服务和 Typeface 品牌个性化 AI 的强大能力，可以用于创建创意简报、电子邮件营销活动以及多媒体在线广告等内容。用户可以在无须切换应用程式的情况下增强品牌内容。企业可以使用 Affinity AI 模式来训练 Typeface AI 应用程式，创建自己的专属内容。

Meta AI 公布开源基础模型 Code Llama，专攻代码生成

Meta AI 近日发布论文，公布了一款针对代码生成功能的基础大语言模型 Code Llama。

据悉，Code Llama 基于 Llama 2 开发，具有开放式模型中领先的性能、填充能力、对大型输入上下文的支持以及用于编程任务的零指令跟随能力。它提供包括基础模型、Python 专用版本以及指令跟随模型等多个模型，每个模型的参数分别为 7B、13B 和 34B。所有模型都是基于 16k 标记序列进行训练，并在最多 100k 标记输入上显示出改进。

Code Llama 以宽松许可证方式开源，允许研究和商业使用。

奇安信发布 Q-GPT 安全机器人和大模型卫士

奇安信集团在京发布了 Q-GPT（奇安信大模型）安全机器人和大模型卫士。

据介绍，Q-GPT 安全机器人是基于奇安信大模型的 " 虚拟安全专家 "，可以全天候工作。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源等功能为一体。

会上，京东方集团和吉利集团等客户现场签约，成为国内首批 Q-GPT 安全机器人和安全大模型用户。

重点论文：

中国科学技术大学联手新加坡管理大学，推出影像生成模型 CgT-GAN

据 Arxiv 页面显示，中国科学技术大学近日联手新加坡管理大学发布一款影像生成模型 CgT-Gan。

CgT-GAN 通过将影像纳入训练过程，使模型能够 " 看到 " 真实的视觉模态。具体来说，研究团队采用对抗训练来教导 CgT-GAN 模型模仿外部文本语料库的短语，同时利用基于 CLIP 的奖励机制提供语义指导。

实验结果显示，CgT-GAN 在所有指标上明显优于现有的方法。

论文地址：点此前往