今天小编分享的教育经验:免费?更新?中美AI竞赛为何突然开启“5.0模式”,欢迎阅读。
以下文章来源于技术领导力 ,作者 Mr.K
作者 | Mr.K
来源 | 技术领导力 管理智慧
咨询合作 | 13699120588
文章仅代表作者本人观点
正月十五刚过,AI 圈就有大事发生:2 月 12 日,CNBC 引述知情人士爆料称,百度计划在今年下半年发布下一代人工智能模型 Ernie 5.0,将在模型多模态能力方面有重大增强。次日凌晨 3 点,OpenAI 首席执行官 Sam Altman 就表示即将发布 GPT-4.5 和 GPT- 5,重点是 GPT- 5 将免费开放。与此同时,文心一言宣布:将于 4 月 1 日 0 时起全面免费,PC 端和 App 端都可使用文心系列最新模型。
中美 AI 行业两大领军企业为何同时宣布免费?全面开放大模型有什么样的深层次原因?全球两大头部 AI 产品免费开放,对 AI 产业有哪些影响?下面 K 哥谈谈自己的观察与思考。
OpenAI 与百度隔空对飙
OpenAI 首席执行官 Sam Altman,于 2 月 13 日凌晨公布了 GPT-4.5 和 GPT-5 的最新消息。免费版 ChatGPT 能在标准智能設定下无限制地使用 GPT - 5 进行对话。在更早之前的 2 月 6 日,OpenAI 宣布 ChatGPT Search 向所有人开放,打开 OpenAI 官网即可直接使用,甚至不需要注册。
另据 CNBC 报道,百度计划在今年下半年发布下一代人工智能模型 Ernie 5.0,将在模型多模态能力方面有重大增强。次日 13 日 Open ai 火速跟进,宣布即将发布 GPT-5。
有意思的是,就在 OpenAI 公布 ChatGPT Search 全面开放的前几个小时,谷歌宣布向所有人开放最新 Gemini 2.0 模型,包括 Flash、Pro Experimental 和 Flash-Lite 三个版本。
2 月 13 日,文心一言在官网宣布将于 4 月 1 日 0 时起全面免费,所有 PC 端和 App 端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级 AI 绘画、多语种对话等功能。
从以上几家 AI 领军企业的最新动向不难发现,大模型开放是大势所趋,科技巨头们都在主动开放各自的大模型产品,让更多用户体验和使用。
更强大模型改写 AI 竞争版图
此次开放的大模型,综合能力非常强悍。以文心一言为例,K 哥作为文心一言的深度用户,对于此前开放的文心大模型 3.5 版和这次全面开放的 4.0 版,还是比较熟悉的。文心大模型 4.0 较之前的版本,综合能力更强大,K 哥做了个测评。
先让文心大模型预测下《哪吒 2》最终全球票房,以下是 3.5 版的预测结果。
对比一下 4.0 的效果,不但给出了更具可能性的结果,整个思考链路非常清晰。
再来看看文生图表现如何,我输入提示词:帮我画一个奥黛丽赫本吃汤圆。以下是 3.5 版本出的图,还是不错的。
4.0 版本基于 iRAG 技术,生成了更准确的人物脸部,而且一次可以生成多张供你选择。
2 月 13 日,文心一言还新上线了深度搜索功能,能针对专业咨询类问题的解决能力进行全面加强,以解决专业问题查询门槛高、查询渠道专精、查询结果分析难度大等使用挑战。
在民生、创业、经济分析等方面问题,能够提供专家级的内容回复;除了搜索能力以外,具备更全面的思考、规划、反思能力,针对工具规划及调用能力上进行全面加强,能够更加 " 聪明 " 的使用多个工具解决各类复杂任务问题。
接着说说大家关心的幻觉问题,RAG 是主要的解决方案,百度在 RAG 技术上具备中文深度理解、多模态检索、垂直领網域定制化以及实时数据整合能力等优势,在中文互联网、企业服务、政务等场景中更具实用性和竞争力。从 RAG 能力实测来看,国内外主流大模型中,百度文心一言综合表现最佳。
在解决图片生成的幻觉问题上,百度提出了 iRAG(image based RAG)技术解决方案,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,去掉了 AI 味儿,而且成本很低。前文测评的案例中,大家已经感受到 iRAG 的强大了,iRAG 具备无幻觉、超真实、没成本、立等可取等特点,在影视作品、漫画作品、连续画本、海报制作等很多领網域都有广泛的应用空间。
在 K 哥看来,文心一言的全面开放,保证了用户享有最佳体验,进一步降低 AI 的使用门槛。在百度的头部效应之下,会有越来越多 AI 公司加入开放的队伍,这将有利于推动中国 AI 行业的发展,促进 AI 普惠。
大模型成本 " 三级跳 "
杰弗里 · 摩尔在《跨越鸿沟》中指出,高科技产品在市场化过程中,会面临一个难以逾越的 " 死亡之谷 ",这是早期使用者到大众用户的过渡阶段,能否 " 跨越裂谷 ",是高科技产品发展的关键。2024 年 AI 产品的用户破圈增长,标志着 AI 已经 " 跨越裂谷 "。
AI 技术突破背后的成本降低,是这次大模型全面开放的核心原因。
一方面,大模型训练成本大幅降低。以百度为例,文心大模型的训练成本不断降低,工程技术上的突破创新主要有 3 点:
1,昆仑芯性价比高,可降低部門算力成本。昆仑芯在性能上表现卓越,能够在更少的计算资源下运行大规模模型(如 DeepSeek-V3/R1),这使得大模型的推理和训练所需的计算量减少,从而直接降低算力成本。
2,万卡集群规模效应,提高资源利用率。百度智能云已点亮万卡集群,并计划扩展至 3 万卡。大规模集群可以通过任务并行调度、弹性算力管理等方式,提高计算资源利用率,避免算力闲置,提高单任务的计算效率,降低整体算力成本。
3,百舸平台助力大规模集群实现高效的部署管理。如:超大规模 HPN 高性能网络,将带宽有效性提升到 90% 以上;创新性散热方案,有效降低能耗,进一步优化成本;高效并行化任务切分策略,将 MFU(GPU 有效利用率指标)提升至 58%;故障恢复时间为分钟级,集群有效训练率达到 98%。
另一方面,推理成本的显著下降。在飞桨深度学习框架的支持下,文心大模型通过优化实现推理性能提升,推理成本显著降低。正如百度创始人李彦宏在阿联酋迪拜出席 " 世界政府峰会 " 上所说的:" 在过去,当我们谈论摩尔定律时,每 18 个月,性能水平或价格都会减半。但是今天,当我们谈论大型语言模型时,增加的成本基本上降低了,可以在 12 个月内降低 90% 以上。"
先进生产力人人可用
这场 AI 开放浪潮,预示着 AI 产业的全新范式:与其构建封闭的技术护城河,不如孕育创新的生态雨林。当大模型成为 " 水电煤 " 一样的基础设施,人类将会创造出远超我们想象的数字文明。
一场属于普通人的生产力革命正在悄悄降临,正如马文 · 明斯基所说的:" 真正重要的不是机器能否思考,而是人类能否因之更好地思考。" 此刻,属于每个人的 AI 时代,才刚刚拉开帷幕。