今天小编分享的互联网经验:大模型竞赛棋至中局,腾讯“混元”加入战场,欢迎阅读。
图片来源:视觉中国
中国市值最高的互联网巨头腾讯,在科技界的期待与压力之下,终于向公众披露了其通用大模型进展。
9 月 7 日,在 2023 年腾讯全球数字生态大会上,腾讯混元大模型正式对外公布。据腾讯介绍,腾讯混元大模型拥有超千亿参数规模,预训练语料超 2 万亿 tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。
此外,腾讯还表示,混元大模型已经接入腾讯 50 多项业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等业务和产品。
据腾讯称,混元大模型将作为腾讯云 MaaS(Model-as-a-Service,模型即服务)服务的底座,企业用户不仅可以直接调用混元,也可以将混元大模型作为基底模型,为不同产业场景构建专属应用。
在大模型竞赛风起云涌的上半场,腾讯的动作并不算快。" 我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。AI 非常重要,但这的确需要有很多的积累。" 腾讯 CEO 马化腾于今年 5 月股东大会上的这句话,解释了腾讯的行动逻辑,他认为,对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要。
腾讯称,早在 2020 年,腾讯就开始研发混元,今年 8 月,混元已经进入公司内应用测试阶段,但一直没有披露最终进展。
在大会上,腾讯集团副总裁蒋杰表示," 在文档处理方面,混元优于国内某大模型,采纳率高出 6 倍,在 Excel 公式的准确性,也远远超过 GPT 3.5;在广告业务场景方面,腾讯混元大模型广告效果超过 Midjournry。"
在腾讯推出混元之前,2023 年以来,科技巨头们已经开启了你追我赶的大模型竞赛。
国内最早发布大模型的巨头是百度。3 月 16 日,百度宣布正式推出文心一言,并宣布开放测试邀请。百度创始人、董事长兼首席执行官李彦宏曾表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义。对于创业者来说," 卷大模型没有意义,卷应用机会更大。"8 月 31 日,百度大模型文心一言率先向全社会开放,应用商店搜索 " 文心一言 " 可直接下载。
而阿里巴巴在 2023 年 4 月紧随百度之后发布了大模型 " 通义千问 ",阿里云随即更新其音频转写平台 " 听悟 ",并配备 AI 驱动的会议分析能力;7 月,阿里云推出生成式 AI 文生图模型 " 通义万相 ";8 月,阿里云通义千问 70 亿参数通用模型和对话模型,两款模型目前均开源、免费、可商用。
阿里巴巴集团董事会主席兼首席执行官张勇曾表示,今天做大模型的公司不少,在中国,往后无非是两条路,一条是像阿里,和云一起,基础模型是普惠的,让更多的开发者来使用;二是企业从基础模型入手,但对某些领網域聚焦,这取决于相关企业在该领網域数据的质量和规模。" 我想会有一大批这样的企业,从大模型起家,而后进入特定领網域。"
360 创始人周鸿祎则说,不要神化大模型," 大模型最核心的能力是写作生成和知识问答,企业客户可以先在一个小切口场景把大模型用起来,再去跟自身业务做协同。" 此前,"360 智腦 " 大模型已面向公众开放。据 360 公布的 2023 年半年报数据显示,"360 智腦 " 已经为 360 带来了近 2000 万元的相关业务收入。
值得关注的是,在同日举办的第二届外滩大会上,蚂蚁集团董事长兼 CEO 井贤栋表示,蚂蚁把科技作为最核心的竞争力,最重要的生产力,发展根本的驱动力,对大模型高度重视,全情投入。据他透露,蚂蚁将在 9 月 8 日发布的大模型,是全栈布局的、纯自研的。
从最初的算法和算力再到如今的应用场景,大模型的入局者越来越多,应用前景也逐渐贴近现实。据蓝鲸财经记者不完全统计,到目前为止,国内已经发布超 130 个大模型," 百模大战 " 已经开启,除了这些巨头之外,还有王小川创业的百川智能、" 商量 SenseChat" 大模型的商汤科技、" 星火认知 " 大模型的科大讯飞等多家公司加入战局。