今天小编分享的科技经验:GPT-5和文心一言宣布免费,开源与闭源分出高下,欢迎阅读。
DeepSeek 对于整个 AI 行业的冲击还在继续,就在元宵节前后,OpenAI 与百度不约而同地对旗下 AI 模型进行了调整。其中百度方面宣布,随着文心大模型的迭代更新和成本不断下降,文心一言将于 4 月 1 日零时起全面免费,即使是刚刚上线的深度搜索功能也不例外。
OpenAI CEO 山姆 · 阿特尔曼则放出大招,不仅曝光了 GPT-4.5 和 GPT-5 的路线图,甚至宣布免费版 ChatGPT 将能够在标准智能設定下无限制地使用 GPT- 5 进行对话。看来他不久前认为 OpenAI 在开源 AI 軟體方面 " 一直站在历史的错误一边 " 是真心的,现在要开始拨乱反正了。
要知道,不久前 OpenAI 宣布 o3 mini 免费向所有用户开放的时候,ChatGPT 的付费用户就曾直接炸锅,并质问阿特尔曼," 付费用户究竟得到了什么,难道仅仅是 GPT-5 的空头支票吗?" 现在看来,付费用户连 GPT-5 这个空头支票都没了。
互联网产品为了实现商业化选择从免费转向付费,类似的例子比比皆是,但从付费转向免费则是少之又少。要知道用户订阅是目前一众 AI 大模型唯一跑通的付费模型,无论文心一言还是 ChatGPT,免费与付费的用户体验可谓是天壤之别。
比如文心一言付费用户使用的是 " 综合能力与 GPT-4 相比毫不逊色 " 的文心大模型 4.0,而免费用户则是使用 2023 年夏季发布的文心大模型 3.5。大洋彼岸的 ChatGPT 对于免费和付费用户的区别对待同样是摆在台面上,他们的 GPT-4 就只对付费用户开放,免费使用的 ChatGPT 则是基于 GPT-3.5、且数量受限。
毕竟如果不将免费与付费版本的差异拉大,用户又怎么会掏钱呢?根据 OpenAI 方面此前在去年 11 月公布的数据显示,该公司约 75% 的业务来自 20 美元 / 月的 ChatGPT Plus 以及 200 美元 / 月的 ChatGPT Pro 等订阅服务,这也是他们实现 34 亿美元年化收入的基础。
这样一来,百度和 OpenAI 的做法就显得很反常了,但让他们一反常态的导火索正是 DeepSeek。此次事件完美诠释了何为开源对闭源的胜利,去年春季周鸿祎与李彦宏围绕开源大模型与闭源大模型究竟谁才是 " 版本答案 " 的论战,如今几乎可以盖棺定论了。
彼时李彦宏认为,闭源大模型在能力上会持续领先、而不是一时领先,并且开源大模型的运行模式和传统开源軟體不同、不是众人拾柴火焰高,闭源有真正的商业模式、并能赚到钱,也只有赚到钱才能聚集算力和人才。而站在对立面的周鸿祎则认为开源才是正途,并为整个社区提供了一个共享、协作和创新的平台,从而推动技术的快速发展。
在 2024 年 4 月这个时间点,李彦宏无疑是更正确的一方。当时闭源阵营中 OpenAI 的 GPT-4 遥遥领先,百度自己的文心大模型 4.0 也在国内市场领跑。反观彼时的开源阵营,Meta 的 LLam 3、阿里的 Qwen2 都还在襁褓中,缺乏 GPT-4 这样级别的模型。
由此李彦宏才在 2024 世界人工智能大会(WAIC 2024)上斩钉截铁地说出," 今天无论是 ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。"
只可惜,李彦宏没能预见 DeepSeek 的横空出世。而 DeepSeek 的优势也不只是模型能力强,更在于开源。虽然 DeepSeek 的开源也延续了 Meta LLama 的 Open-Weight(开放权重)模式,训练代码、数据等关键信息并未完全公布,但由于他们在论文里把关键方法基本都公开了,所以跟开源没什么两样,也给了整个业界 " 站在巨人肩膀上 " 的机会。
在 OpenAI 的 ChatGPT 一鸣惊人之前,业界更青睐谷歌的 Transformer 模型,追求的是如何设计出更小、更快,但更准确的神经网络。而 ChatGPT 的成功就在于提出了一个新的思路,那就是加大参数、加高算力的 Scaling law 也是坦途,并且真的能让 AI 模型产生智能。
只可惜基于 Scaling law 的大模型需要海量的算力、算法和数据资源,谷歌、微软、Meta、字节跳动、阿里巴巴等大厂的投资更是动辄以百亿美元计,他们不断大手笔采购标注数据、搭建 GPU 万卡集群。而 DeepSeek 通过强化学习与蒸馏技术等,有关训练方法与工程架构的创新,直接让大模型的算力门槛大幅下降,在实现同样智能水平的情况下,DeepSeek 使用的 MoE 模型架构训练只需花费更少的计算量。
开源的 DeepSeek 使得中小团队不用再砸锅卖铁堆算力,可以将更多精力放在 AI 应用创新、而不是重复造轮子上,就彻底改变了 AI 圈的游戏规则,让 "AI 平权 " 有了变为现实的可能。既然基于 DeepSeek 的方式,再结合自己的数据训练模型可行,就使得大模型在消费级市场做付费订阅成了鸡肋,毕竟在水平相似的情况下,用户必然会选择免费的产品。
DeepSeek 的开源让闭源大模型的付费策略成了无垠之水,所以文心一言、ChatGPT 继续做付费就要面临一个问题,即付费版的独特价值在哪?正是因为回答不了这个问题,百度和 OpenAI 索性就直接转向免费,由此也创造了这次开源对闭源的胜利。