今天小编分享的互联网经验:从技术到行业,留下三个悬而未决的问题,欢迎阅读。
图片来源:视觉中国
蓝鲸新闻 12 月 30 日讯(记者 朱俊熹)ChatGPT 发布两年以来,AI 浪潮继续奔涌。这一年," 卖铲人 " 英伟达依然是最大受益者,一度成为全球市值最高的公司。凭借 Apple Intelligence 的叙事,苹果年底市值逼近 4 万亿美元的历史性关口。行业领军者 OpenAI 也以千亿估值跃升为全球第三大独角兽。
无论国内外,科技公司或喊出 "AII in AI" 的口号,或在战略版图中继续扩大 AI 的地位。在公开活动、公司财报中,AI 已成为不可或缺的主题。科技行业之外,更多的公司着手将其与自身业务结合。对个体来说,人们开始习惯在生活中随时打开 AI 对话助手,和人工智能交流各种天马行空的想法。
2024 年,AI 技术继续向前迈进,行业加速洗牌,同时也留下了一些悬而未决的问题。
Scaling Law 遭遇瓶颈如何突破?
当回顾 ChatGPT 何以成功掀起 AI 热潮时,一个共识是受到了数据、算法、算力三架马车的驱动。2020 年,OpenAI 研究团队提出,随着模型规模、训练数据集和计算资源的增加,模型性能也将持续提升。这就是指导模型预训练的关键法则 Scaling Law,在过去几年间推动了大模型的飞跃。
但今年下半年以来,对 Scaling Law 是否撞墙、边际效益递减的争论愈演愈烈。先是 OpenAI 迟迟未亮相的下一代大模型 GPT-5 被传训练受阻,即使投入了巨大成本,模型的进步却在放缓,未能实现从 GPT-3.5 到 GPT-4 的跃升程度。随后,谷歌、Anthropic 等多家公司也被曝面临类似的困境,不得不延后旗舰模型的发布,寻求新的技术路线。
代替 GPT-5,OpenAI 在 9 月释出了推理模型 o1,并在三个月后发布继任者 o3 模型。该系列模型采取不同于 GPT 序列的命名规则,也被普遍视为新范式的开始。推理模型将更多的计算资源投入到推理阶段而非预训练阶段,通过增加强化学习和思考时间,实现模型性能的提升。
在 AI 行业看来,推理模型有望成为预训练 scaling 放缓的解法。国内大模型独角兽月之暗面创始人杨植麟曾公开表示,o1 模型的意义在于提升了 AI 的上限。当原先的 Scaling Law 因互联网优质数据的耗尽而遭遇瓶颈,它至少证明了通过强化学习和大语言模型的结合,能够实现进一步的 scaling," 完全有可能是一个很重要的开端 "。
由此,国内外大模型玩家也开启了转向推理范式、继续追赶 OpenAI 之路。截至 2024 年底,谷歌已推出首个推理模型 Gemini 2.0 Flash Thinking。其首席科学家 Jeff Dean 称,该模型经过训练能够利用思维过程来增强推理能力," 当增加推理时间计算时,取得了令人鼓舞的结果!"
国内现已具备可媲美 o1 的推理模型,包括幻方量化旗下 DeepSeek 的 R1-Lite 预览版、阿里通义的 QwQ 模型。近期,月之暗面先后发布数学模型 k0-math、更新版视觉思考模型 k1,在数理化等特定能力上表现优于 o1。另有字节跳动等厂商透露正在布局推理模型方面,预计明年将会迎来更多此类模型的面世。
尽管各家公司对推理模型这一进化方向展现出一定的共识,但其现有使用场景仍极其有限。在回答用户提问时,推理模型需要花费更多的思考时间。OpenAI 研究人员在 o1 模型发布时就曾坦言,o1 模型并不总是比 GPT-4o 好,对于许多不需要推理的任务,有时等待 o1 的回复不如直接快速获得 GPT-4o 的响应。
与传统的大语言模型相比,推理模型的开发成本更低,但使用时的推理成本大幅增加。OpenAI 将部抽成本转嫁到用户侧,完整版 o1 模型的访问权限被纳入新推出的付费套餐 ChatGPT Pro 中,定价则由基本套餐的 20 美元 / 月升至 200 美元 / 月。而 o3 模型虽然在基准测试中的得分远超 o1,高计算模式下完成单个任务就需要承担数千美元的昂贵成本。
目前看来,对普通用户而言,推理模型的可用之处尚不明显。硅谷科技媒体 The Information 曾援引知情人士说法称,只有一小部分 ChatGPT 用户会定期使用 o1-preview。这类模型似乎更有助于科研人员群体,这也是 OpenAI 重点瞄准的目标人群。
承载商业愿景的 AI 超级应用会到来吗?
相较于一年前市场的如火如荼,今年 AI 热潮已开始经历周期性的冷却。当科技巨头们继续鼓吹要大幅投入 AI、追求长期回报的策略时,AI 泡沫论的质疑也在蔓延。更现实的问题是,承受着高昂的研发成本,大模型厂商们为了生存也要找到可行的商业路径。
大模型转向落地的趋势,直接体现在各家公司推广话术的变化中。比起单纯地以大模型性能、参数、跑分论优劣,更注重展示模型的应用落地场景。
为抢占早期市场,一场 " 价格战 " 爆发了。今年 5 月,DeepSeek、另一创企智谱 AI 率先降低旗下模型的调用价格。随后字节跳动在发布其豆包大模型时打出最响一炮,主力模型价格较行业便宜 99.3%。在此之后,原先持谨慎态度的阿里云、百度、腾讯云也纷纷宣布跟进降价,大模型由以分定价进入以厘定价的阶段。
在此轮价格战中,攻势猛烈的大多是国内云厂商,AI 创企鲜有参与。云厂商们希望能通过亮出模型降价的招牌,吸引更多客户使用其云服务。降价带来的短期损失能够从云服务受益中再补贴回来,还能进一步扩大其公有云市场份额。
数据显示,这样的获客手段确是有效的。据各公司最新披露,字节豆包通用模型的日均 tokens 使用量已超过 4 万亿,较七个月前首次发布时增长了 33 倍,百度文心大模型日均调用量达 15 亿次。百度创始人李彦宏曾表示,如果 API 调用量能在一年内上涨 10 倍至 20 亿,代表大模型算是 " 成了 "。
受成本降低和模型进化的推动,AI 应用也开始涌现。ChatGPT 式的 AI 对话助手成为各家 " 标配 ",包括字节豆包、月之暗面 Kimi、腾讯元宝等。但据 36 氪此前报道,字节管理层认为即使是处于国内第一梯队的豆包,在对话轮次、时长等关键指标上的表现依然不够理想。因此判断 AI 对话类产品可能只是 AI 产品的 " 中间态 ",并提升了 AI 创作平台即梦的优先级。
可自主感知环境、执行行动并完成设定目标的智能体,成为众多 AI 企业押注的下一个应用风口。谷歌在推出最新的 Gemini 2.0 大模型时,就表明是为智能体时代构建的。今年李彦宏更是反复强调,百度将智能体视为最重要的战略方向,认为智能体这一 AI 应用的最主流形态即将迎来爆发点。智谱 AI 自 10 月起推出多款自主智能体,能够模拟人类操作手机与电腦,展示出智能体更大的应用潜力。
AI 搜索赛道的竞争也日趋白热化。不仅谷歌、百度、阿里等巨头正在积极利用 AI 改造传统搜索引擎,OpenAI、月之暗面等新兴创企也开始在产品中集成 AI 搜索功能。近期,小红书低调上线 AI 搜索新产品 " 点点 ",并在 App 内开启了小范围内测。有 AI 搜索开发者曾对蓝鲸新闻表示,搜索是用户每天高频使用的场景,已然成为 AI 公司的兵家必争之地。
随着 AI 应用方向在垂直领網域出现分化,同时应用层涌入了更多的新公司,明年或将看到形式更为多样的 AI 应用。编程、情感陪伴、智能硬體等领網域呈现出蓬勃上升的态势。
市场仍在期待,AI 时代何时能迎来像微信这样的超级应用。对此,行业领导者们态度不一。李彦宏称超级应用不如超级能干,智谱 CEO 张鹏则表示,超级应用的出现并不完全由技术驱动,还要考虑市场和用户是否准备好、需求发掘以及一点点运气。" 不要过早地只看这个结论,保持一点耐心。"
大厂和创企,谁能继续留在牌桌?
临近年末,AI 大模型领網域的融资消息再次活跃起来。" 六小龙 " 之一的创企阶跃星辰近期宣布完成数亿美元的 B 轮融资,上海国资、腾讯入股。本月中,智谱 AI 再获新一轮三十亿人民币融资。同为清华系、主攻端侧 AI 的面壁智能完成了数亿元新融资,AI 视频创企爱诗科技获得近 3 亿元 A+ 轮融资。
与今年上半年相比,下半年大模型公司的融资进度明显放缓。今年 2 月,阿里巴巴豪掷重金再投大模型创企,希望仿照微软与 OpenAI 的模式,以算力的形式支付部分投资。其中,阿里向月之暗面投资了约 8 亿美元,购入 36% 的股权,月之暗面完成的超 10 亿美元融资至今仍是国内 AI 领網域的最大单笔融资记录。不到半月,阿里又领投另一创企 MiniMax 的 6 亿美元融资,推高其估值达 25 亿美元。
加上年初的投资,阿里已集齐中国最头部的五家大模型初创企业,包括零一万物、智谱 AI、百川智能、月之暗面和 MiniMax。阿里、腾讯等互联网的大手笔再次激起对大模型的 FOMO(错失恐惧)情绪,高榕创投、高瓴资本等财务投资机构也跟投了部分独角兽。
蓝鲸新闻梳理创投数据服务商 IT 桔子的统计,截至 12 月 30 日,2024 年国内人工智能行业共录得 483 条投资事件,总投资金额约为 655 亿元,较去年分别下滑了 18.8%、6.1%。其中,今年下半年融资事件数较上半年更少,但融资金额更高。
从产业链来看,包含大模型层在内的 AIGC 领網域在融资数量上虽仅占总数的 24%,却吸走了 57% 的融资金额。巨额投资集中流向了月之暗面、智谱 AI、百川智能等头部大模型创企。AI 应用层方面,融资数量占到整体的一半以上,金额却远不及模型层。
关于 AI 领網域的投资,金沙江创投主管合伙人朱啸虎或许能代表一派鲜明的观点:比起大模型更看好应用赛道。朱啸虎认为,基础服务最终会由云厂商提供,创业公司则会在 AIGC 应用端迎来大量机会。今年,他曾多次表态称,"AI 创业公司最好的结果就是卖给大厂 "、" 五年后将不再有独立的大模型公司存在 "。
事实上,步调更快的国外 AI 行业已出现创业公司 " 卖身潮 "。今年 3 月,微软支付 6.5 亿美元获得曾为 OpenAI 竞争对手的 Inflection AI 的軟體授权,并聘用了其联创在内的多数员工。6 月,亚马逊与 AI 创企 Adept 达成类似的交易。10 月,谷歌斥资 27 亿美元与 Character.AI 进行同样的交易,后者称将放弃大模型研发,专注于改善产品。
头部基座模型厂商进一步收缩至谷歌、Meta、背靠马斯克的 xAI、受微软支持的 OpenAI、受亚马逊支持的 Anthropic 等几家公司。
而在国内,同为大厂但并未放手投资、押注自身业务的字节跳动今年表现尤为突出。虽然公认字节在大模型领網域的起步要慢半拍,但其 C 端产品豆包的用户表现已实现反超。QuestMobile 数据显示,截止 10 月,豆包月活跃用户数达 4839 万人,远超 Kimi 智能助手、文小言的 1650 万和 1179 万。互联网时代素以 "App 工厂 " 著称的字节还推出了十几款 AI 应用,覆盖了绘画、学习、视频甚至硬體产品等多品类。
在 B 端,对外开放字节 AI 技术工具的云服务平台火山引擎攻势猛烈。火山总裁谭待虽未透露公有云收入受大模型带动的具体数据,但对使用大模型的客户数量及使用程度表示肯定。谭待曾表态称," 从云原生到 AI 云原生,火山希望做成这块的领军企业。"
此前昆仑万维创始人周亚辉在社交平台发文称," 我年初说字节 23 年 AI 战略是不及格,但这完全不影响字节 24 年 AI 战略的满分表现。这符合我对这个组织快速迭代能力(卷死人能力)的预期。"
当大厂逐步扩大射程范围,AI 独角兽关于技术和应用的细分选择也越发清晰。月之暗面、阶跃星辰专注现有的 To C 生产力工具,智谱 AI 继续探索 B 端商业化模式,零一万物选择在国内聚焦 To B、海外 To C 先行。此外,MiniMax 的现有优势仍在其出海战略和多模态能力上,百川智能则明确集中于医疗赛道。
凭借这一年的融资,这些创业公司至少获得了继续留在牌桌上的机会。而迈入 2025 年,这场大厂与创企间的 AI 战局将日渐胶着,或许行业会迎来新的大洗牌。谁能在 AI 的道路上走得更远,将成为下一阶段的悬念。