今天小编分享的科技经验:大模型爆火,文心一言起大早,赶晚集?,欢迎阅读。
2 月 13 日,百度宣布 4 月 1 日起文心一言将全面免费。
2 月 14 日,百度宣布文心下一代模型 4.5 系列 6 月 30 日起开源。
受相关消息影响,截至 2 月 13 日港股收盘,百度集团股价当日累计上涨 5.74%,报收 94 港元 / 股。 要知道百度是国内最早的大模型,此前,文心一言采取基础版免费、专业版收费的模式,专业版定价 59.9 元 / 月,连续包月优惠价 49.9 元 / 月。
而现在国内的大模型们,通义千问、Kimi、豆包、腾讯混元、deepseek 如雨后春笋,文心一言起了个大早,赶上这晚集了吗?
01 曾是大模型赛道的先行者
文心一言:作为国内最早的 AI 语言模型,有人说对于您来说全都是后来者居上,你觉得是为什么?
ChatGPT 爆火后,大模型对个人生产力的提升,以及在各行业的巨大商业价值愈加清晰。2023 年 2 月,就在百度公开宣布要推出 " 文心一言 " 之际,百度搜索、智能云到自动驾驶等各产品方面的合作方随即明确需要这样的产品,很快,超过 600 家合作伙伴宣布加入文心一言生态,期待尽早用上最新最先进的大语言模型。
2023 年 3 月 16 日,百度新一代大语言模型文心一言正式启动邀测。8 月 31 日,文心一言率先向全社会全面开放。开放首日,文心一言共计回复网友超 3342 万个问题。12 月 28 日,百度首席技术官王海峰在第十届 WAVE SUMMIT 深度学习开发者大会上宣布文心一言用户规模已突破 1 亿。
当时的李彦宏说:文心一言将改变云计算游戏规则。
百度高管诚实表示文心一言还不够成熟之时,百度股价应声而落:李彦宏诚实指出,自己体验时并不完美,这类大语言模型还远未到发展完善的阶段;百度首席技术官王海峰也提到模型目前 " 训练不够充分 "。
2025 年的今天,文心一言好像也没有突破以上 " 不完美 ",于是我向他提了这个问题。文心一言回答了我很多,其中它总结说 " 虽然作为早期 AI 语言模型的我具有一定的历史地位,但在技术和应用不断发展的背景下,后来的 A 语言模型确实在很多方面取得了显著的优势。"
02 很早却很后
尽管 " 起大早 ",但 " 文心一言 " 是否真的领先?
百度深耕 AI 领網域十余年,从底层的高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,形成了全球范围内少有的在 " 芯片 - 框架 - 模型 - 应用 " 的 IT 四层技术栈架构,并且各个层面都有领先业界的自研技术和产品。
从优势来看,文心一言背靠百度强大数据和技术积累,拥有海量中文语料库,在中文理解方面具有一定优势。刚才提到它拥有超过 600 家合作伙伴,百度根式积极布局应用生态,与多家企业合作,推动产品落地。
算力芯片,是至关重要的。2021 年 6 月,百度智能芯片及架构部门完成独立融资,成立昆仑芯(北京)科技有限公司,首轮估值约 130 亿元,百度芯片首席架构师欧阳剑出任昆仑芯公司 CEO。在此之前一年,百度已经试产了第一代云端通用人工智能计算处理器 " 昆仑 1" 芯片,这在当时国内唯一一款经历过互联网大规模核心算法考验的云端 AI 芯片。在芯片部门独立融资两个月后,百度就宣布第二代昆仑芯片 " 昆仑 2" 正式量产。
不难看出,百度在 AI 领網域的布局极为宏大,野心勃勃。" 文心一言 " 不过是基于百度文心大模型展开研发进程中的一个微小环节。从百度文心官网呈现的内容便能窥知一二,在文心大模型的整体规划里,对话功能仅仅占据了极小的一部分。不妨设想一下,倘若没有 ChatGPT 突如其来地在全球范围内掀起巨大波澜,引发广泛关注,也许 " 文心一言 " 还会在项目排期表上沉寂许久,许久都难有问世的机会。
反观 DeepSeek,成功好像不是偶然。
从最直观的下载量来看,DeepSeek 在 140 个市场的应用商店下载排行榜上居首位,短短 18 天,下载量达到 1600 万次,超过 ChatGPT 同期表现。
DeepSeek - R1 模型训练使用了约 2000 个英伟达专用芯片,能充分利用英伟达芯片强大的并行计算能力和 CUDA 生态系统,实现高效的深度学习计算。在硬體适配方面,DeepSeek 也在积极探索与国产硬體的结合,如昇腾、海光等芯片,稀疏计算等技术使其在国产硬體上也能有较好的性能表现,降低了对特定国外芯片的依赖。
由于其创新的架构设计和训练策略,DeepSeek 在推理等任务中对芯片的需求相对灵活,训练时仅需百卡级规模。
除了 DeepSeek,可灵、即梦、豆包这些平台可能采用轻量化模型或定制化架构,注重互動体验和特定场景的优化(如创意生成、对话互動)。总的来看,DeepSeek 适合复杂任务和技术场景。文心一言在中文处理和文化理解上表现突出。可灵、即梦、豆包更适合创意生成和轻量级互動。
03 百度,能赶上晚集吗?
追求短期商业化,忽视技术深度研发,是网友在文心一言宣布开源之前对它的评价。
文心一言的不足确实很明显,在技术层面与领先模型相比,在逻辑推理、创造性文本生成等方面存在差距。在应用层面,实际应用场景有限,用户体验有待提升,缺乏现象级应用案例。在生态层面,开源生态建设滞后,开发者社区活跃度不高。
而百度文心一言宣布将于 4 月 1 日零时起取消收费限制,向所有用户开放其最新模型及全部高级功能,这一决策标志着国产大模型服务正式进入普惠化阶段。
文心一言还同步上线了深度搜索功能。这项新功能具备更强大的思考规划能力和工具调用能力,能够为用户提供专家级的内容回复,并可以处理多场景任务,实现多模态的输入与输出。目前,用户可以在文心一言官网率先体验这一功能,移动端 App 的相关功能也将很快推出。
这一举措不仅体现了文心大模型在技术迭代和成本优化方面取得的突破,更展现出百度在 AI 领網域的战略布局和市场竞争决心。随着免费开放政策的实施,AI 技术的应用门槛将进一步降低,这对推动人工智能技术的普及和创新发展具有重要意义。
李彦宏本是大模型闭源的支持者。 在 2024 世界人工智能大会等场合,他多次表达了对闭源大模型的支持观点。
从性能和成本角度来看,李彦宏认为同样参数规模下,开源模型能力不如闭源,开源模型若想追平闭源,需要更大参数规模,这意味着推理成本更高、反应速度更慢。而闭源模型通常由专业团队针对特定用途优化,与专门硬體紧密集成,可实现规模经济,推理成本更低。
尽管他认为开源大模型在学术研究、教学领網域等特定场景下有存在的价值,但在激烈的商业竞争环境中,需要让业务效率比同行更高、成本比同行更低,这时商业化的闭源模型是最能打的。
李彦宏曾表示,闭源才有真正的商业模式,才能聚集人才和算力,优秀人才会更倾向于选择闭源模型的团队,因为闭源可以提供更好的资源和发展空间。
DeepSeek 等的崛起给文心一言带来一定压力,而开源可吸引更多开发者和用户,提升百度在市场中的竞争力。另一方面,随着技术发展,大模型推理成本大幅下降,百度有条件进行开源,推动技术更广泛应用。
AI 是否也将走向价格战?文心一言同步宣布免费的还有 OpenAI。北京时间 2 月 13 日凌晨 3 点,OpenAI 首席执行官 Sam Altman 也公布了 GPT-4.5/5 将很快陆续发布,免费版 ChatGPT 将在标准智能設定下无限制使用 GPT-5 进行对话。据悉,OpenAI 很快发布 GPT-4.5,就是传说中的猎户座模型(Orion),也是最后一个非思维链模型。接着会整合 GPT 和 O 系列两大模型打造一个全新的系统,能自动选择思考和非思考功能,适用于多种任务。奥尔特曼称,这将是 OpenAI 最后一个 " 非思维链模型 "。与 o3 及 OpenAI 其他推理模型不同,非思维链模型在数学和物理等领網域往往不太可靠。
推动两大闭源模型的 DeepSeek 是这么看文心一言的翻盘的:
百度系股票应声大涨,对企业级用户大面积部署可谓利好,但能否成为李彦宏口中的超级应用? 让我们拭目以待。