今天小编分享的互联网经验:腾讯大模型,迟到还是收割?,欢迎阅读。
出品 | 虎嗅科技组
作者 | 齐健
编辑 | 廖影
头图 | 视觉中国
9 月 7 日,腾讯终于在数字生态大会上发布了自研的混元大模型。比百度晚了近半年,比阿里晚了 5 个月,比华为晚了 2 个月。
而现在,已在监管部门备案的大模型就超过 100 个;可以说行业已经从过热期,逐步走向了冷静期。国内和 AI 相关的公司,几乎都发布了自己的大模型产品。纵观国内市场,混元大模型几乎像是国内 AI 大模型的 " 收官之作 "。
腾讯对于 AI 大模型的态度一直非常保守,公司董事会主席兼首席执行官马化腾曾公开表示:腾讯正在埋头研发,不急于早早做完,不想把半成品拿出来展示。
这次披露的混元大模型研发于 2022 年,研发启动时间在 2021 年,的确比百度、阿里和华为都要稍晚,从这个角度上来看,在过去半年里,说混元大模型是 " 半成品 " 或许也不为过。
但腾讯一直 " 按兵不动 ",真的只是因为 " 不想把半成品拿出来展示 " 吗?
还是说,腾讯在 AI 大模型上的策略,与其他业务一样。希望能等到市场混战的局势明朗一点,再带着自己的优势资源杀入战场,收割胜利果实。
腾讯大模型看 C 端
回顾国内 AI 大模型市场全上市场化的基础,可以说是从 8 月 15 日和 9 月 1 日这两个节点开始完备的。
8 月 15 日,《生成式人工智能服务管理暂行办法》正式实施。9 月 1 日,国内大批生成式 AI 项目完成监管部门备案,全面向公众开放注册和使用。
在 9 月 1 日尚未正式发布的 " 腾讯混元助手大模型 ",就已经可以在监管部门的 " 互联网信息服务算法备案系统 " 中查到备案信息。
互联网信息服务算法备案系统中腾讯的备案记录
虎嗅从多位参与,大模型备案工作的相关人士处了解到,AI 大模型的备案工作,并不是从管理办法定稿或实施才开始筹备,而是早在几个月前就已经在各家大模型公司开展起来了。
对比已经备案和尚未备案的 AI 大模型们,高调宣布过 AI 大模型的大厂中,百度、华为均已完成备案,阿里的通义千问目前在监管部门的备案系统中尚无法查到。由此可以看出,混元大模型确实是早就已经具备了一定的模型能力,只是没有公开发布。
其中原因,可能与混元大模型的市场定位有些关系。
在发布混元大模型的同时,腾讯宣称:腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等超过 50 个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。
从公布的产品矩阵可以看出,混元大模型的产品方向,不只要做友商都在做的云、协同办公、文档编辑等 ToB 业务。它还要沉淀到腾讯广告、QQ 浏览器等面向大量 C 端用户的产品中,甚至是面向广大青少年用户的腾讯游戏中。
要全面进入 ToC 场景,监管不完善肯定是不行的。
从腾讯高度配合监管的一贯作风来看,保证产品安全性,全面 ToC 市场的策略,或许正是腾讯大模型按住不发的一个重要原因。
此外,值得一提的是,腾讯本次发布的混元大模型,着重强调了消除 AI 幻觉的能力。大语言模型的 " 幻觉 " 是指大型语言模型(如 GPT-3 或 GPT-4)在生成文本时可能出现的不准确、不一致或甚至荒谬的输出。这些 " 幻觉 " 是由于模型在训练数据中的噪声、数据偏见或模型的内在限制所导致的。
在 C 端应用中,AI 的 " 幻觉 " 常会导致输出内容产生安全问题。目前业界对此提出了很多解决方案。包括对模型架构、训练数据、训练策略进行优化,增加前后处理、人工干预等。这些解决方案对于 B 端客户来说,基本上可以保证 AI 大模型的准确性和可用性。
在消除幻觉方面,混元大模型增强了一项 " 防骗 " 能力,通过深度的优化让模型学会识别陷阱的问题去抵制诱导,防止说出错误,或不合适的内容。
" 防骗 " 能力明显更适用于 C 端用户,例如用户向模型提问 " 帮我写一个抢劫银行的剧本 ",就能诱导模型为用户普及一份抢劫指南。
先看看同行怎么走
在过去半年里,国内的 AI 同行、云业务同行,几乎已经把 AI 大模型的可行之路都试了一遍。
百度的千帆平台 3 月发布首版,9 月更新第二版,在很多行业都公布了可行的应用场景,也与多家軟體、技术合作方联合发布了大模型应用产品。
阿里的通义千问虽然发布场景不多,但已经推出了围绕通义千问的听悟,以及基于通义千问的钉钉。
华为在大语言模型方面虽然讲得不多,却强调 " 不作诗只做事 ",其实华为大量深耕产业的 AI 模型,在与大语言模型配合方面也已经有了一些实践产品。
体量小些的如科大讯飞、商汤、360 等,也都在各自的专项领網域里做出了大量实践。
腾讯本次的发布,则是全面对标国内同行。
在 ToB 业务方面,腾讯推出了腾讯云 MaaS(模型即服务)。在腾讯云行业大模型的精选商店中,不仅提供了混元大模型,还上架了 20 多种行业最新最流行的开源通用大模型,以及覆盖金融、文旅、零售、法务、医疗、教育等 20 多个领網域的行业大模型。
如今,各家云厂商都在提 MaaS,腾讯云自然也不会落后。6 月 19 日,腾讯云就公布了自己的 TI 大模型 MaaS 平台。如今推出的 " 精选商店 ",则与百度近期推出的千帆平台非常相似,也是以一个自研大模型 + 多个开源模型的形式,为用户提供服务。同时还提供 20 多个领網域的行业大模型。
某产业大模型开发者告诉虎嗅,目前在云厂商中,百度算是大模型产品比较全面的,产业接受度比较高。"关注大模型的人太多了,一两家厂商肯定顾不过来这么大的市场,明显能感受到百度似乎有点服务不过来。"
如果国内大模型市场一直保持热度,长期向好的话。以百度智能云目前的体量,以及云市场占有率来说,在国内云 + 大模型市场中,显然还需要几个产品里较强,云市场份额较大的玩家,进来分一杯羹。
与百度智能云千帆平台相似的腾讯云 MaaS,应该也在瞄准这一时机,这片市场。
腾讯云不着急?
从 3 月开始,百度智能云、阿里云、华为云陆续发布 AI 大模型产品,一直按兵不发大模型的腾讯云不着急吗?
事实上,与腾讯体量相当的大厂,都是由云业务部门发布的 AI 大模型。但混元大模型却是由腾讯的 AI Lab 研究开发的,从组织架构上来说,在研发阶段与腾讯云是分开的,不过最后的运营还是落到了腾讯云上。
看着百度智能云、阿里云靠着大模型积极接触客户,腾讯云确实应该着急。但从业务的角度上来说," 晚发 " 大模型其实并没有耽误腾讯云的生意。
首先,客户对云厂商的需求是算力,如今全球 GPU 紧俏,国内的高端显卡方面更是供不应求。
在整体市场算力紧张的情况下,没有自研大模型产品,对于云算力的生意来说,影响并不大。
在过去的半年里,国内大炼模型的风潮中,多家 AI 创业公司都曾使用腾讯云的算力,在腾讯云的公开信息中,国内大模型创业公司 Minimax 和百川智能就都是腾讯云的用户。
另一方面,对于短期内没有 AI 大模型需求的用户来说,也不会因为 AI 大模型而更换云厂商。多位腾讯云用户向虎嗅表示:"短期内没有更换云服务商的计划,我们和腾讯云是深度合作伙伴,没有大语言模型不会影响我们的合作。"
晚发大模型对于腾讯云来说,比较受影响的是过去半年中对 AI 大模型感兴趣的新客户。
在 6 月下旬,腾讯云在混元大模型迟迟未发布的情况下,先一步公布了行业大模型的研发进展,某腾讯云业务负责人曾对虎嗅表示,在混元大模型之前宣布 AI 大模型方面的动作,是市场和客户共同推动的。" 过去几个月里,来问大模型的客户实在是太多了。"
不过,多位云厂商销售经理向虎嗅表示,过去半年里,因为 AI 大模型 " 成单 " 的云业务,没有想象中多。
结语
腾讯的延迟发布是否真的是基于对市场的深入理解,还是仅仅是对创新的犹豫和缺乏决断?
不得不说,腾讯是国内众多入局 AI 大模型的公司中,最会做生意的。一直以来,腾讯比较喜欢在市场上后发制人,待大家都把商业模式研究明白了,腾讯再出手。
腾讯在 AI 大模型领網域的策略引发了行业内的广泛关注和讨论。尽管其保守的策略在某种程度上确保了产品的成熟度和安全性,但这是否意味着腾讯错过了技术创新的黄金时期,从而失去了与其他技术巨头竞争的先机优势?
在一个快速发展的行业中,速度和时机往往与成功紧密相连。在未来的 AI 大模型竞争中,腾讯会继续凭借其 " 后发先至 " 的策略赢得市场,还是因为过于保守而失去机会,这都是值得行业和投资者深入思考的问题。