AI大模型激烈混战！一天之内，华为、阿里、腾讯等巨头纷纷出手

今天小编分享的互联网经验：AI大模型激烈混战！一天之内，华为、阿里、腾讯等巨头纷纷出手，欢迎阅读。

最近几个月，国产大模型的内卷激烈程度可以用 " 神仙打架 " 来形容。本周五，大模型混战又达到了新高度，据华尔街见闻不完全统计，仅在今天，就有华为、阿里、腾讯、商汤、京东等企业发布或更新大模型。

" 百模大战 " 的盛况中，谁最有可能造出中国版 GPT-4？

华为云盘古大模型 3.0 正式发布

7 月 7 日，华为云在开发者大会 2023 上发布盘古大模型 3.0。华为常务董事、华为云 CEO 张平安表示，盘古大模型 3.0 是完全面向行业的大模型，包括 "5+N+X" 三层架构。

张平安在会上表示，盘古大模型不会作诗，只做事，将围绕 " 行业重塑 "" 技术扎根 "" 开放同飞 " 三大创新方向，持续打造核心竞争力，为行业客户、伙伴及开发者提供更好的服务。

三层架构分别为：

L0 层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，提供满足行业场景中的多种技能需求。盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型，匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集，包括 NLP 大模型的知识问答、文案生成、代码生成，以及多模态大模型的影像生成、影像理解等能力，这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型，盘古提供一致的能力集。

L1 层是 N 个行业大模型，华为云既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等大模型；也可以基于行业客户的自有数据，在盘古大模型的 L0 和 L1 层上，为客户训练自己的专有大模型。

L2 层为客户提供了更多细化场景的模型，更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景，为客户提供 " 开箱即用 " 的模型服务。

盘古大模型采用完全的分层解耦设计，可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集，也可以单独更新基础模型，也可以单独更新能力集。

在 L0 和 L1 大模型的基础上，华为云还为客户提供了大模型行业开发套件，通过对客户自有数据的二次训练，客户就可以拥有自己的专属行业大模型。同时，根据客户不同的数据安全与合规诉求，盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

阿里 AIGC 应用 " 通义万相 "

在 2023 年世界人工智能大会上，阿里云正式推出 AI 绘画新品 " 通义万相 "。

基于阿里研发的组合式生成模型 Composer，通义万相提出了基于扩散模型的「组合式生成」框架，通过对配色、布局、风格等影像设计元素进行拆解和组合，提供了高度可控性和极大自由度的影像生成效果。

用户可以在通义万相中输入提示词，以输出相应影像。除文生图以外，通义万相也推出了包括风格迁移、相似图生成等功能。

从此，图片设计的门槛将大幅降低，无论是艺术设计、游戏，还是文创，都将迎来一场变革。

目前，通义万相具有以下三大功能：文生图、相似图生成、风格迁移。

文生图功能为基本的形式，只要输入 prompt，选定创作风格（水彩、油画、中国画、扁平插画、二次元、素描、3D 卡通等），通义万相就可以自动生成海量的创意灵感。通义万相已正式上线，对外提供服务。

相似图生成则可以让用户根据现有素材，快速地批量扩展相似素材。只要用户提供一张参考影像，就可以获得一张与之内容、风格类似的影像。

而风格迁移，则是为一张原图生成一幅指定风格的新图。

下图为来自 " 新智元 " 的测试，使用通义万相将下图穿着白纱女性，改成法国印象派画家雷诺阿的风格。

迁移完成后，得到了这样一幅印象派的人物肖像。

据 " 新智元 " 测评表示，通义万相的部分作图能力，已经在逼近全球最牛 AI 作画神器 Midjourney。

腾讯 MaaS 平台更新

世界人工智能大会期间，腾讯云宣布更新 MaaS 平台，将行业大模型能力应用到金融风控、同传翻译、数智人客服等新场景中；其中，首次公布的金融风控大模型，相比传统风控有 10 倍效率提升。

在技术底座领網域，自研星脉高性能计算网络、向量数据库，为大模型的行业应用提供更充沛的算力基础设施。其中，最新更新的腾讯云自研星脉高性能计算网络，能提升 40% 的 GPU 利用率，节省 30%~60% 的模型训练成本，为 AI 大模型带来 10 倍通信性能提升。基于腾讯云新一代算力集群 HCC，可支持 10 万卡的超大计算规模。腾讯云 AI 原生向量数据库，最高支持 10 亿级向量检索规模，延迟控制在毫秒级，相比传统单机插件式数据库检索规模提升 10 倍，同时具备百万级每秒查询（QPS）的峰值能力。

在应用创新方面，腾讯云行业大模型能力应用到金融风控、互動翻译、数智人客服等场景中，极大提升了智能应用效率。

行业大模型加持的金融风控解决方案，相比之前有了 10 倍效率提升，通过腾讯积累超过 20 年的黑灰产对抗经验和上千个真实业务场景，整体反欺诈效果比传统模式有 20% 左右的提升。企业可以基于 prompt 模式，迭代风控能力，从样本收集、模型训练到部署上线，实现全流程零人工参与，建模时间也从 2 周减少到仅需 2 天。即便样本积累有限的情况下，也可以完成快速搭建，跳过 " 冷启动 " 过程。

在互動翻译领網域，基于行业大模型技术加持，同传技术不再需要百万级的训练数据，仅需 " 小样本 " 训练就能实现较好效果，专业领網域的翻译也能减少人工调优的参与，保障翻译效果，在多个垂直行业落地。其中，腾讯同传已经连续六年为世界人工智能大会主论坛提供 AI 同传服务。

在数智人领網域，今年腾讯云推出了小样本数字人工厂，仅需少量数据、24 小时内即可复刻 2D 数字分身，让企业应用数智人服务成本大大降低。现在，依托 AI 生成算法，数智人 3D 形象的复刻速度得到大幅提升，通过生成式动作驱动，结合行业大模型能力，可让企业获得更 " 个性化、专业、自然逼真 " 的数智员工，让 " 面对面 " 专业服务成为可能。

商汤大模型全面更新

世界人工智能大会期间，在 " 大爱无疆 · 日日新 " 人工智能论坛上，商汤科技宣布 " 商汤日日新 SenseNova" 大模型体系将多方位全面更新，以及在该体系下的一系列大模型产品更新和落地成果。

作为千亿级参数的自然语言处理模型，商汤商量 SenseChat 2.0 版本突破了大语言模型输入长度限制，并推出不同参数量级的模型版本，可完美适配移动端、云端等不同终端及场景的应用需求，降低部署成本。商汤的自研生成式大模型商汤秒画 SenseMirage 3.0 的模型参数从今年 4 月首次发布以来的 10 亿提升至 70 亿量级，能够实现专业摄影级的图片细节刻画。

不仅如此，商汤如影 SenseAvatar 2.0 数字人生成平台相较 1.0 版本的语音和口型流畅度提升 30% 以上，实现 4K 高清视频效果，并带来 AIGC 生成形象及数字人歌唱功能。此外，商汤琼宇 SenseSpace 2.0 的空间重建效率提升 20%，渲染性能提升 50%，每 100 平方公里场景的建图时间仅需 38 小时即可完成（1200 TFLOPS/ 秒算力支持）；而商汤格物 SenseThings 2.0 对小物体的纹理及材质还原达到毫米级精细度，并突破对高反光和镜面物体的采集难题。

在金融领網域，商汤与银行、保险、券商等客户展开合作，利用数字人进行智能客服、智慧营销等工作，并通过接入大语言模型能力，提供投研分析、研报撰写等新功能，实现降本增效。此外，挂载金融知识库后，还能 100% 基于客户的产品说明进行内容问答输出，并实现信息及时更新。

在医疗场景，商汤基于海量医学知识和临床数据打造了中文医疗语言大模型 " 大医 "，提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力，未来也即将支持医学影像、文本、结构化数据等多模态综合分析，并可不断提升医疗语言理解和推理能力，持续赋能医院诊疗效率及患者服务提升。

其他 AI 企业进展

本土 AI 独角兽出门问问发布 " 序列猴子 "

出门问问携内测探索大模型 " 序列猴子 " 及 AI CoPilot 解决方案亮相世界人工智能大会。据介绍，" 序列猴子 " 是一款具备多模态生成能力的大语言模型，模型以语言为核心的能力体系涵盖 " 知识、对话、数学、逻辑、推理、规划 " 六个维度，能够同时支持文字生成、图片生成、3D 内容生成、语言生成和语音识别等不同任务。" 序列猴子 " 具备自然语言理解、知识、逻辑以及推理等能力，并可以基于这些能力进行对话。

京东：正在训练大模型，对其前景很有信心

京东集团副总裁、探索研究院院长何晓冬表示，目前训练时间在两个月左右的基础通用大模型，成本估计在几千万元，对大模型的商业前景和落地场景很有信心。他建议，创业公司入局大模型应该找到属于自己的 " 护城河 "，面对目前的 " 百模大战 " 现状，何晓冬认为，对于市场而言，有压力和竞争是好事，将有效促进行业发展。