谷歌发布大模型，国内“百模大战”鏖战正酣

今天小编分享的互联网经验：谷歌发布大模型，国内“百模大战”鏖战正酣，欢迎阅读。

图片来源 @视觉中国

文｜趣解商业，作者 | 周佟

2022 年底，OpenAI 发布 ChatGPT 掀起了人工智能热浪，时隔一年后，谷歌终于 " 杀回 " 人工智能赛道。

当地时间，12 月 6 日，谷歌正式发布了 Gemini 大模型。谷歌 CEO 桑达尔 · 皮查伊称，Gemini 的发布，是谷歌新时代的开始；但人们最关注的问题还是 Gemini 和 GPT-4 相比水平谁更高。

谷歌公司高管称，三种不同版本的套件中的 Gemini Pro，表现优于 GPT-3.5，但暂未直接回应 Gemini 与 GPT-4 相比表现如何的问题。不过外界有测评认为，它们已经超过了 GPT-4。

图片来源：微博截图

不管是否超过，作为大模型的 " 风向标 "，由一年前推出的 ChatGPT 引发的 " 生成式人工智能 " 革命，仍在不断地改写着每个人的认知。

如今巨头谷歌已 " 上线 "，过去一年，在 ChatGPT 的引领下，国内的大模型企业也从摸索和尝试，逐渐步入深水区。

" 百模大战 "，从震惊到追赶

ChatGPT 的出现并非毫无征兆。

创造它的 OpenAI 早在 2015 年便已成立，并在 2018 年就推出了初代生成式预训练模型 GPT-1，这也是 ChatGPT 最初的原型。

公开资料显示，在 GPT-1 之前，业内的 NLP 模型（Neuro logic level 自然语言处理）主要是基于针对特定任务的大量标注数据进行训练，能力有限。

GPT 是第一个结合 Transformer（多层变换器）结构和自监督预训练目标的模型，在自然语言推理、问答任务和常识推理等方面取得了突破，为此它们也获得了微软 10 亿美元投资。随后，从 GPT-1 到 GPT-2，到 GPT-3，短短 2 年时间里 GPT 的能力不断提高。

图片来源：OpenAI 官网截图

2022 年 11 月 27 日，随着由 GPT-3.5 修改而来的人工智能对话聊天机器人 ChatGPT 的推出，这个一直在小圈子走红的研究成果，才第一次为大众所认识。能聊天、画画、写文案、编代码，强大的功能，使得 ChatGPT 一经发布迅速走红，5 天时间注册用户数超过百万，两个月时间月活突破 1 亿，成为史上增长最快的消费者应用。

消息传至国内，一石激起千层浪。人工智能竟然已经发展到如此地步了？震惊之下，淘宝上售卖 ChatGPT 账号甚至都成了一门生意。与此同时，看到巨大商机的各界大佬们，也纷纷下场，表态要尽快推出自己的大模型。

率先落地的是百度。2023 年 3 月 16 日，国内首个大语言模型 " 文心一言 " 问世，发布会上，百度 CEO 李彦宏直言，" 生成式 AI 是任何企业都不应错过的大机会 "。

而百度之所以能够拔得国内大语言模型的 " 头筹 "，源自其过去 10 多年中，在 AI 研发上的坚持投入。按李彦宏的说法，文心大模型的第一个版本早在 2019 年就发布了，此后每年都有更新，文心一言的发布只是百度多年努力的 " 自然延续 "。

紧接着，3 月 29 日，360 集团发布人工智能战略及 360 智腦大模型 1.0 版本，创始人周鸿祎现场演示了大模型在搜索场景的应用。4 月 11 日，阿里巴巴的 " 通义千问 " 大模型在阿里云峰会上揭晓，CEO 张勇宣布未来阿里巴巴所有产品都将接入 " 通义千问 "。5 月 6 日，科大讯飞星火大模型发布，董事长刘庆峰表态要在 10 月 24 日实现中文超过 ChatGPT，英文赶上 ChatGPT。9 月 7 日，腾讯混元大模型上线。

至此，国内传统的三大互联网巨头 "BAT" 全部下场。

此外，华为、京东、字节跳动、商汤科技、昆仑万维等等都陆续推出了大模型产品，甚至连移动、联通、电信三大运营商，长虹等家电生产企业，清华、复旦、中科院等科研院所和高校，都发布了各自的大模型。

5 月底举行的中关村论坛上，有专家披露，中国 10 亿级参数规模以上大模型已发布了 79 个；在 7 月初的 2023 世界人工智能大会中有信息表明，中国已有 130 家研发大模型的公司。此时，ChatGPT 引起的大模型研发热，已经带动国内形成 " 百模大战 " 的格局。

不过相比当初外卖界的 " 百团大战 "，" 百模大战 " 对资金的需求更为苛刻。

根据 NVIDIA 官方信息，在训练底层模型阶段，训练一次 1750 亿参数的 GPT-3 需要 34 天、使用 1024 张 A100 GPU 芯片，而为了维持日常推理，OpenAI 至少需要 3.24 万张 A100，以此推算，ChatGPT 仅硬體成本就超过了 8 亿美元。

昆仑万维集团 CEO 方汉更是公开表示，" 没有 2000 张 A100 的卡，实验都做不了 "。为此，海天瑞声、因赛集团等 "AI 概念股 " 甚至接连发布定增预案，募集资金用于训练大模型。

此时，如何在缩小与 ChatGPT 差距的同时，尽快找到应用落地的方向，实现自我造血，成为了 " 百模大战 " 中，每一位参与者都要面对的问题。

人工智能 + 将所有行业做一遍？

从商业角度分析，大模型带来的机遇，可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。

在今年 8 月 31 日、11 月 4 日，根据网信办《生成式人工智能服务管理办法（征求意见稿）》的要求，国内先后有两批涉及 26 家公司的 AI 大模型和 151 个深度合成衣务算法通过备案，陆续向全社会开放服务，其中的商业化尝试，也基本是围绕这三类展开的。

图片来源：网信办截图

大模型超强的人机对话、图文及音视频生成能力，不但让其在传统客服场景中获得了广泛应用，对于游戏、影视制作等也产生了深远影响。

阿里、美团的在线智能客服算法，以及中国移动的 " 九天大模型 "、中国电信的 TeleChat 大模型等，都属于此类产品，将应用场景直接锁定在了智能客服、智慧政务等方面。在今年的亚运会上，科大讯飞与中国移动联合推出了基于星火大模型的 5G 新通话，接完电话之后，申请服务，会即刻转成文字、生成纪要、生成待办事项。

游戏、影视制作方面，导演陆川曾在采访时表示，" 用 AI 画电影海报，15 秒出来的效果比专业海报公司做一个月的还要好。" 光线传媒、华策影视等率先尝试将大模型应用在影视创作中的公司，股价在年中都收获了一波大涨。

原有市场需求再扩大，则体现在对于传统业务的更新上，这也是大模型应用最广泛的领網域。以传统的搜索引擎为例，接入文心一言后，在百度搜索框里输入问题，给出的可以不再是链接，而是一个更准确的答案。

10 月 17 日，文心一言 4.0 发布，根据李彦宏现场的演示，除了搜索外，百度地图、网盘、文库等十余款应用，都接入文心一言完成了重构。

旗下业务众多的腾讯，对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品，也已完成了接入腾讯混元大模型的测试，并取得了初步效果。

图片来源：腾讯混元官网截图

此外，在传统的教育、医疗、汽车等领網域，大模型也获得了广泛的应用。接入讯飞星火大模型后，科大讯飞的学习机实现了 AI 一对一辅助教学、中英文作文批改、口语陪练等功能；百度推出了产业级的医疗行业大模型 " 灵医 "，有超过 1000 家企业级机构先行体验；华为云盘古大模型的赋能，则让问界新 M7 在智能驾驶领網域 " 遥遥领先 "，两个月大定突破 10 万台。

在创造新的市场需求方面，AI 超级助理、AI 机器人等需求也被不断创造出来。前者，包括文心一言、讯飞星火、360 智腦、通义千问等在内的各家通用大模型都有相应产品提供，它们大都能理解用户的语言语义，并具备影像理解能力，可以通过调用軟體 API，使用各种各样的工具来帮助用户完成任务；而后者，在今年 8 月 16 日举行的 2023 世界机器人大会上，包括优必选、追觅、宇树在内的不少于 10 家机器人企业，展出了相关产品，赛道也正呈现井喷态势。

图片来源：通义官网截图

不过，在一片欣欣向荣背后，也存在隐忧。比照各家大模型的应用不难发现，不管是提高效率还是扩大需求，市场上绝大多数的应用，实现的功能都较为雷同。

以 AI 学习机为例，除了科大讯飞有相关产品外，接入子曰大模型的网易有道、接入 MathGPT 的好未来、接入银河大模型的作业帮，以及接入文心一言的百度、接入 360 智腦的 360，都有类似的产品在售。功能方面，各自宣传的也都大同小异，AI 一对一辅导、全科 AI 作业助手、虚拟人口语教练等，站在消费者的角度，几乎很难体会到其中的差别。

尽管各家都能拿出一堆的排名榜单来论证，自己的大模型得分更高、能力更强，但体现在实际应用中时，那百分之几甚至是千分之几的差别，还是让人不得不产生疑惑：我们真的需要这么多大模型吗？

AI 原生应用至上，亟待 " 安卓 " 出现

对于大模型步入 " 深水区 " 将会遇到的挑战，百度创始人、董事长兼首席执行官李彦宏提出了自己的看法。

近期，在深圳 2023 西丽湖论坛开幕式上，李彦宏就直言，拥抱 AI 时代，是 " 一把手工程 "。因为 CTO、IT 负责人更关注技术本身，认为自己做大模型是交作业，结果不仅资源浪费，而且用不起来，最后一地鸡毛；只有一把手才会真的关注，新技术如何提升自己业务的关键指标，一把手上阵，才能让新技术真正为企业所用。

不断地重复开发基础大模型是对社会资源的极大浪费。在李彦宏看来，国内如今的大模型实在是太多了。根据统计，截止 10 月份，国内已经发布的大模型达到了 238 个，比 5 月科技部统计时的 79 个，翻了三倍，但与此同时，市场上真正的 AI 原生应用却很难找出几个。一把手应该主导做 AI 原生应用，而不是大模型。

"人类进入 AI 时代的标志，不是产生很多的大模型，而是产生很多的 AI 原生应用。" 李彦宏认为，大模型时代其实和 PC 时代、移动互联网时代极为类似。PC 时代，主流的作業系統只有 Windows 一个，移动互联网时代，也基本只有安卓和 iOS 两家，然而围绕着它们，诞生了无数的应用軟體。

大模型本身也属于基础底座，类似作業系統，最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。"AI 原生时代，我们需要 100 万量级的 AI 原生应用，但是不需要 100 个大模型。"

这确实是国内的大模型玩家们不得不面对的难题。尽管市场上大模型产品有几百个，但细究起来都是在各玩各的，360 智腦只为自家搜索赋能，讯飞星火此前主要是为科大讯飞的学习机产品服务。

相比大模型训练的高额花费，如果不能够有效扩大 " 朋友圈 "，让自家的大模型为更多人所用，只是一味投入，显然难以为继。

上半年大涨的 AI 概念股们，下半年几乎集体熄火，与此不无关系。科大讯飞（002230.SZ）10 月 19 日发布的三季报显示，前三季度实现营业收入 126 亿元，同比下滑 0.27%，净利润 9936 万元，同比跌了 76%。根据公告，其利润下滑的主要原因，就是源自对大模型的 " 坚定投入 "。

图片来源：财报截图

三六零（601360.SH）的情况也没有好多少，上半年尽管新兴业务 "360 智腦 " 创造了近 2000 万元营收，但在 9.1 亿元的总收入中，占比不过 2.1%。

在 " 百模大战 " 进入深水区后，如何围绕各自的大模型，" 扩大朋友圈 " 创造生态，争取更多的开发者，成了国内通用大模型玩家们不约而同的选择。

在 1024 开发者节上，科大讯飞董事长刘庆峰透露，除了联合相关企业发布了包含金融、汽车、住建、法律等在内的 12 个行业大模型外，在讯飞星火上，已有 1.5 万助手开发者，开发了超过 2.9 万个助手应用。

百度则先后推出了 " 百度智能云千帆大模型平台 "、" 灵境矩阵 "，帮助企业开发自己的专属大模型，目前平台月活企业数已近万家。

阿里巴巴旗下的通义千问，从 18 亿、70 亿、140 亿到 720 亿参数规模，率先成为业界首个 " 全尺寸开源 " 的大模型，以吸引更多合作伙伴加入，共促通义千问生态建设。

去年 11 月，阿里巴巴发布 AI 开源社区 " 魔搭 "，中国 80% 的大模型研发机构把魔搭作为模型开源的首发平台。短短一年时间，魔搭汇聚了 280 万开发者、2300 多个优质模型，模型下载量超过 1 亿。

正如中国科学院院士、中国计算机学会（CCF）开源发展委员会主任王怀民所说，开源是 AI 发展的重要驱动力，AI 开源社区不仅将有力推动 AI 迈向广泛的落地应用，还将助力中国从开源世界的参与者逐步成长为引领者。

大模型行业的未来，如智能手机系统的迭代。曾经，除了苹果的 iOS 外，手机作業系統中还有诺基亚的 Symbian、微软的 Windows Phone、黑莓的 BlackBerry，但是最终它们无一例外都败给了 " 在 2012 年，就拥有 10 万开发者，超过 40 万活跃应用 " 的 Android。

期待国产大模型们，早日跑出本赛道的 "Android"。