大模型竞赛棋至中局，腾讯“混元”加入战场

今天小编分享的互联网经验：大模型竞赛棋至中局，腾讯“混元”加入战场，欢迎阅读。

图片来源：视觉中国

中国市值最高的互联网巨头腾讯，在科技界的期待与压力之下，终于向公众披露了其通用大模型进展。

9 月 7 日，在 2023 年腾讯全球数字生态大会上，腾讯混元大模型正式对外公布。据腾讯介绍，腾讯混元大模型拥有超千亿参数规模，预训练语料超 2 万亿 tokens，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。

此外，腾讯还表示，混元大模型已经接入腾讯 50 多项业务并取得初步效果，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等业务和产品。

据腾讯称，混元大模型将作为腾讯云 MaaS（Model-as-a-Service，模型即服务）服务的底座，企业用户不仅可以直接调用混元，也可以将混元大模型作为基底模型，为不同产业场景构建专属应用。

在大模型竞赛风起云涌的上半场，腾讯的动作并不算快。" 我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。AI 非常重要，但这的确需要有很多的积累。" 腾讯 CEO 马化腾于今年 5 月股东大会上的这句话，解释了腾讯的行动逻辑，他认为，对于工业革命来讲，早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要。

腾讯称，早在 2020 年，腾讯就开始研发混元，今年 8 月，混元已经进入公司内应用测试阶段，但一直没有披露最终进展。

在大会上，腾讯集团副总裁蒋杰表示，" 在文档处理方面，混元优于国内某大模型，采纳率高出 6 倍，在 Excel 公式的准确性，也远远超过 GPT 3.5；在广告业务场景方面，腾讯混元大模型广告效果超过 Midjournry。"

在腾讯推出混元之前，2023 年以来，科技巨头们已经开启了你追我赶的大模型竞赛。

国内最早发布大模型的巨头是百度。3 月 16 日，百度宣布正式推出文心一言，并宣布开放测试邀请。百度创始人、董事长兼首席执行官李彦宏曾表示，模型本身是不直接产生价值的，基于基础大模型开发出来的应用才是模型存在的意义。对于创业者来说，" 卷大模型没有意义，卷应用机会更大。"8 月 31 日，百度大模型文心一言率先向全社会开放，应用商店搜索 " 文心一言 " 可直接下载。

而阿里巴巴在 2023 年 4 月紧随百度之后发布了大模型 " 通义千问 "，阿里云随即更新其音频转写平台 " 听悟 "，并配备 AI 驱动的会议分析能力；7 月，阿里云推出生成式 AI 文生图模型 " 通义万相 "；8 月，阿里云通义千问 70 亿参数通用模型和对话模型，两款模型目前均开源、免费、可商用。

阿里巴巴集团董事会主席兼首席执行官张勇曾表示，今天做大模型的公司不少，在中国，往后无非是两条路，一条是像阿里，和云一起，基础模型是普惠的，让更多的开发者来使用；二是企业从基础模型入手，但对某些领網域聚焦，这取决于相关企业在该领網域数据的质量和规模。" 我想会有一大批这样的企业，从大模型起家，而后进入特定领網域。"

360 创始人周鸿祎则说，不要神化大模型，" 大模型最核心的能力是写作生成和知识问答，企业客户可以先在一个小切口场景把大模型用起来，再去跟自身业务做协同。" 此前，"360 智腦 " 大模型已面向公众开放。据 360 公布的 2023 年半年报数据显示，"360 智腦 " 已经为 360 带来了近 2000 万元的相关业务收入。

值得关注的是，在同日举办的第二届外滩大会上，蚂蚁集团董事长兼 CEO 井贤栋表示，蚂蚁把科技作为最核心的竞争力，最重要的生产力，发展根本的驱动力，对大模型高度重视，全情投入。据他透露，蚂蚁将在 9 月 8 日发布的大模型，是全栈布局的、纯自研的。

从最初的算法和算力再到如今的应用场景，大模型的入局者越来越多，应用前景也逐渐贴近现实。据蓝鲸财经记者不完全统计，到目前为止，国内已经发布超 130 个大模型，" 百模大战 " 已经开启，除了这些巨头之外，还有王小川创业的百川智能、" 商量 SenseChat" 大模型的商汤科技、" 星火认知 " 大模型的科大讯飞等多家公司加入战局。