从技术到行业，留下三个悬而未决的问题

今天小编分享的财经经验：从技术到行业，留下三个悬而未决的问题，欢迎阅读。

图片来源：视觉中国

蓝鲸新闻 12 月 30 日讯（记者朱俊熹）ChatGPT 发布两年以来，AI 浪潮继续奔涌。这一年，" 卖铲人 " 英伟达依然是最大受益者，一度成为全球市值最高的公司。凭借 Apple Intelligence 的叙事，苹果年底市值逼近 4 万亿美元的历史性关口。行业领军者 OpenAI 也以千亿估值跃升为全球第三大独角兽。

无论国内外，科技公司或喊出 "AII in AI" 的口号，或在战略版图中继续扩大 AI 的地位。在公开活动、公司财报中，AI 已成为不可或缺的主题。科技行业之外，更多的公司着手将其与自身业务结合。对个体来说，人们开始习惯在生活中随时打开 AI 对话助手，和人工智能交流各种天马行空的想法。

2024 年，AI 技术继续向前迈进，行业加速洗牌，同时也留下了一些悬而未决的问题。

Scaling Law 遭遇瓶颈如何突破？

当回顾 ChatGPT 何以成功掀起 AI 热潮时，一个共识是受到了数据、算法、算力三架马车的驱动。2020 年，OpenAI 研究团队提出，随着模型规模、训练数据集和计算资源的增加，模型性能也将持续提升。这就是指导模型预训练的关键法则 Scaling Law，在过去几年间推动了大模型的飞跃。

但今年下半年以来，对 Scaling Law 是否撞墙、边际效益递减的争论愈演愈烈。先是 OpenAI 迟迟未亮相的下一代大模型 GPT-5 被传训练受阻，即使投入了巨大成本，模型的进步却在放缓，未能实现从 GPT-3.5 到 GPT-4 的跃升程度。随后，谷歌、Anthropic 等多家公司也被曝面临类似的困境，不得不延后旗舰模型的发布，寻求新的技术路线。

代替 GPT-5，OpenAI 在 9 月释出了推理模型 o1，并在三个月后发布继任者 o3 模型。该系列模型采取不同于 GPT 序列的命名规则，也被普遍视为新范式的开始。推理模型将更多的计算资源投入到推理阶段而非预训练阶段，通过增加强化学习和思考时间，实现模型性能的提升。

在 AI 行业看来，推理模型有望成为预训练 scaling 放缓的解法。国内大模型独角兽月之暗面创始人杨植麟曾公开表示，o1 模型的意义在于提升了 AI 的上限。当原先的 Scaling Law 因互联网优质数据的耗尽而遭遇瓶颈，它至少证明了通过强化学习和大语言模型的结合，能够实现进一步的 scaling，" 完全有可能是一个很重要的开端 "。

由此，国内外大模型玩家也开启了转向推理范式、继续追赶 OpenAI 之路。截至 2024 年底，谷歌已推出首个推理模型 Gemini 2.0 Flash Thinking。其首席科学家 Jeff Dean 称，该模型经过训练能够利用思维过程来增强推理能力，" 当增加推理时间计算时，取得了令人鼓舞的结果！"

国内现已具备可媲美 o1 的推理模型，包括幻方量化旗下 DeepSeek 的 R1-Lite 预览版、阿里通义的 QwQ 模型。近期，月之暗面先后发布数学模型 k0-math、更新版视觉思考模型 k1，在数理化等特定能力上表现优于 o1。另有字节跳动等厂商透露正在布局推理模型方面，预计明年将会迎来更多此类模型的面世。

尽管各家公司对推理模型这一进化方向展现出一定的共识，但其现有使用场景仍极其有限。在回答用户提问时，推理模型需要花费更多的思考时间。OpenAI 研究人员在 o1 模型发布时就曾坦言，o1 模型并不总是比 GPT-4o 好，对于许多不需要推理的任务，有时等待 o1 的回复不如直接快速获得 GPT-4o 的响应。

与传统的大语言模型相比，推理模型的开发成本更低，但使用时的推理成本大幅增加。OpenAI 将部抽成本转嫁到用户侧，完整版 o1 模型的访问权限被纳入新推出的付费套餐 ChatGPT Pro 中，定价则由基本套餐的 20 美元 / 月升至 200 美元 / 月。而 o3 模型虽然在基准测试中的得分远超 o1，高计算模式下完成单个任务就需要承担数千美元的昂贵成本。

目前看来，对普通用户而言，推理模型的可用之处尚不明显。硅谷科技媒体 The Information 曾援引知情人士说法称，只有一小部分 ChatGPT 用户会定期使用 o1-preview。这类模型似乎更有助于科研人员群体，这也是 OpenAI 重点瞄准的目标人群。

承载商业愿景的 AI 超级应用会到来吗？

相较于一年前市场的如火如荼，今年 AI 热潮已开始经历周期性的冷却。当科技巨头们继续鼓吹要大幅投入 AI、追求长期回报的策略时，AI 泡沫论的质疑也在蔓延。更现实的问题是，承受着高昂的研发成本，大模型厂商们为了生存也要找到可行的商业路径。

大模型转向落地的趋势，直接体现在各家公司推广话术的变化中。比起单纯地以大模型性能、参数、跑分论优劣，更注重展示模型的应用落地场景。

为抢占早期市场，一场 " 价格战 " 爆发了。今年 5 月，DeepSeek、另一创企智谱 AI 率先降低旗下模型的调用价格。随后字节跳动在发布其豆包大模型时打出最响一炮，主力模型价格较行业便宜 99.3%。在此之后，原先持谨慎态度的阿里云、百度、腾讯云也纷纷宣布跟进降价，大模型由以分定价进入以厘定价的阶段。

在此轮价格战中，攻势猛烈的大多是国内云厂商，AI 创企鲜有参与。云厂商们希望能通过亮出模型降价的招牌，吸引更多客户使用其云服务。降价带来的短期损失能够从云服务受益中再补贴回来，还能进一步扩大其公有云市场份额。

数据显示，这样的获客手段确是有效的。据各公司最新披露，字节豆包通用模型的日均 tokens 使用量已超过 4 万亿，较七个月前首次发布时增长了 33 倍，百度文心大模型日均调用量达 15 亿次。百度创始人李彦宏曾表示，如果 API 调用量能在一年内上涨 10 倍至 20 亿，代表大模型算是 " 成了 "。

受成本降低和模型进化的推动，AI 应用也开始涌现。ChatGPT 式的 AI 对话助手成为各家 " 标配 "，包括字节豆包、月之暗面 Kimi、腾讯元宝等。但据 36 氪此前报道，字节管理层认为即使是处于国内第一梯队的豆包，在对话轮次、时长等关键指标上的表现依然不够理想。因此判断 AI 对话类产品可能只是 AI 产品的 " 中间态 "，并提升了 AI 创作平台即梦的优先级。

可自主感知环境、执行行动并完成设定目标的智能体，成为众多 AI 企业押注的下一个应用风口。谷歌在推出最新的 Gemini 2.0 大模型时，就表明是为智能体时代构建的。今年李彦宏更是反复强调，百度将智能体视为最重要的战略方向，认为智能体这一 AI 应用的最主流形态即将迎来爆发点。智谱 AI 自 10 月起推出多款自主智能体，能够模拟人类操作手机与电腦，展示出智能体更大的应用潜力。

AI 搜索赛道的竞争也日趋白热化。不仅谷歌、百度、阿里等巨头正在积极利用 AI 改造传统搜索引擎，OpenAI、月之暗面等新兴创企也开始在产品中集成 AI 搜索功能。近期，小红书低调上线 AI 搜索新产品 " 点点 "，并在 App 内开启了小范围内测。有 AI 搜索开发者曾对蓝鲸新闻表示，搜索是用户每天高频使用的场景，已然成为 AI 公司的兵家必争之地。

随着 AI 应用方向在垂直领網域出现分化，同时应用层涌入了更多的新公司，明年或将看到形式更为多样的 AI 应用。编程、情感陪伴、智能硬體等领網域呈现出蓬勃上升的态势。

市场仍在期待，AI 时代何时能迎来像微信这样的超级应用。对此，行业领导者们态度不一。李彦宏称超级应用不如超级能干，智谱 CEO 张鹏则表示，超级应用的出现并不完全由技术驱动，还要考虑市场和用户是否准备好、需求发掘以及一点点运气。" 不要过早地只看这个结论，保持一点耐心。"

大厂和创企，谁能继续留在牌桌？

临近年末，AI 大模型领網域的融资消息再次活跃起来。" 六小龙 " 之一的创企阶跃星辰近期宣布完成数亿美元的 B 轮融资，上海国资、腾讯入股。本月中，智谱 AI 再获新一轮三十亿人民币融资。同为清华系、主攻端侧 AI 的面壁智能完成了数亿元新融资，AI 视频创企爱诗科技获得近 3 亿元 A+ 轮融资。

与今年上半年相比，下半年大模型公司的融资进度明显放缓。今年 2 月，阿里巴巴豪掷重金再投大模型创企，希望仿照微软与 OpenAI 的模式，以算力的形式支付部分投资。其中，阿里向月之暗面投资了约 8 亿美元，购入 36% 的股权，月之暗面完成的超 10 亿美元融资至今仍是国内 AI 领網域的最大单笔融资记录。不到半月，阿里又领投另一创企 MiniMax 的 6 亿美元融资，推高其估值达 25 亿美元。

加上年初的投资，阿里已集齐中国最头部的五家大模型初创企业，包括零一万物、智谱 AI、百川智能、月之暗面和 MiniMax。阿里、腾讯等互联网的大手笔再次激起对大模型的 FOMO（错失恐惧）情绪，高榕创投、高瓴资本等财务投资机构也跟投了部分独角兽。

蓝鲸新闻梳理创投数据服务商 IT 桔子的统计，截至 12 月 30 日，2024 年国内人工智能行业共录得 483 条投资事件，总投资金额约为 655 亿元，较去年分别下滑了 18.8%、6.1%。其中，今年下半年融资事件数较上半年更少，但融资金额更高。

从产业链来看，包含大模型层在内的 AIGC 领網域在融资数量上虽仅占总数的 24%，却吸走了 57% 的融资金额。巨额投资集中流向了月之暗面、智谱 AI、百川智能等头部大模型创企。AI 应用层方面，融资数量占到整体的一半以上，金额却远不及模型层。

关于 AI 领網域的投资，金沙江创投主管合伙人朱啸虎或许能代表一派鲜明的观点：比起大模型更看好应用赛道。朱啸虎认为，基础服务最终会由云厂商提供，创业公司则会在 AIGC 应用端迎来大量机会。今年，他曾多次表态称，"AI 创业公司最好的结果就是卖给大厂 "、" 五年后将不再有独立的大模型公司存在 "。

事实上，步调更快的国外 AI 行业已出现创业公司 " 卖身潮 "。今年 3 月，微软支付 6.5 亿美元获得曾为 OpenAI 竞争对手的 Inflection AI 的軟體授权，并聘用了其联创在内的多数员工。6 月，亚马逊与 AI 创企 Adept 达成类似的交易。10 月，谷歌斥资 27 亿美元与 Character.AI 进行同样的交易，后者称将放弃大模型研发，专注于改善产品。

头部基座模型厂商进一步收缩至谷歌、Meta、背靠马斯克的 xAI、受微软支持的 OpenAI、受亚马逊支持的 Anthropic 等几家公司。

而在国内，同为大厂但并未放手投资、押注自身业务的字节跳动今年表现尤为突出。虽然公认字节在大模型领網域的起步要慢半拍，但其 C 端产品豆包的用户表现已实现反超。QuestMobile 数据显示，截止 10 月，豆包月活跃用户数达 4839 万人，远超 Kimi 智能助手、文小言的 1650 万和 1179 万。互联网时代素以 "App 工厂 " 著称的字节还推出了十几款 AI 应用，覆盖了绘画、学习、视频甚至硬體产品等多品类。

在 B 端，对外开放字节 AI 技术工具的云服务平台火山引擎攻势猛烈。火山总裁谭待虽未透露公有云收入受大模型带动的具体数据，但对使用大模型的客户数量及使用程度表示肯定。谭待曾表态称，" 从云原生到 AI 云原生，火山希望做成这块的领军企业。"

此前昆仑万维创始人周亚辉在社交平台发文称，" 我年初说字节 23 年 AI 战略是不及格，但这完全不影响字节 24 年 AI 战略的满分表现。这符合我对这个组织快速迭代能力（卷死人能力）的预期。"

当大厂逐步扩大射程范围，AI 独角兽关于技术和应用的细分选择也越发清晰。月之暗面、阶跃星辰专注现有的 To C 生产力工具，智谱 AI 继续探索 B 端商业化模式，零一万物选择在国内聚焦 To B、海外 To C 先行。此外，MiniMax 的现有优势仍在其出海战略和多模态能力上，百川智能则明确集中于医疗赛道。

凭借这一年的融资，这些创业公司至少获得了继续留在牌桌上的机会。而迈入 2025 年，这场大厂与创企间的 AI 战局将日渐胶着，或许行业会迎来新的大洗牌。谁能在 AI 的道路上走得更远，将成为下一阶段的悬念。