今天小编分享的科技经验:国产大模型落地,等一个“Sora时刻”,欢迎阅读。
满天飞的大模型,有几个能挣到钱?
文 | 世昕
编 | 园长
仅凭几十个提示词,就能生成一段流畅完整、视角多元的视频,其内容质量几乎能以假乱真,甚至不亚于专业拍摄团队,这就是 OpenAI 首款文生视频产品 Sora,一经发布便激起千层浪,让全球感受到新的 AI 震撼。
2024 年的 AI 故事,伴随着这款杀手级应用的横空出世拉开帷幕,Sora 再度让所有人注意到了 AI 的无限可能性,为略显疲软的市场再打了一针鸡血。
回看 2023 年,AI 产业迎来了空前发展,海内外 AI 企业如雨后春笋,国内更是迎来了声势浩大的 " 百模大战 ",通义千问、文心一言、智谱 AI、盘古大模型 ..... 卷多模态、卷算力、卷 token,一时间百家争鸣。
但一个核心的问题仍旧盘桓在所有人头上:大模型产品到底如何实现商业落地?商业是技术发展的内生动力之一,唯有业务飞轮转动起来,才能让企业们真正走向未来。
垂直大模型,走向落地
2023 年的 " 百模大战 " 到底为行业带来了什么?
或许是一个清晰的商业认知:垂直化,才是大模型走向落地的实际路径。
" 事实上 AI 大模型产业还处在一个很初级的阶段,创造的内容、解决的问题还相对比较初级。"初心资本合伙人李可佳向刺猬公社表示。
初心资本是国内一家专注于人工智能、智能硬體、前沿科技及探索性投资的早期股权投资机构,对于 AI 产业有着较深的洞察。
李可佳用丹尼尔 · 卡尼曼《思考,快与慢》一书中的系统概念为我们解释了目前大模型产业的发展阶段:
丹尼尔 · 卡尼曼认为,在人的大腦中有两套系统,系统 1 指的是快系统,是一种涉及直觉的思维方式,用于快速决策。它做出决策的依据主要依赖于偏差、偏见和错误的启发法,它是无意识且快速的;系统 2 则是一种慢系统,它更为慢速和理性,负责对系统 1 进行有意识的控制,特别是在涉及复杂问题的情形中,是否形成系统 2 也是区分人与动物的重要指标。
" 现在整个产业的发展仍处于系统 1 阶段,在对创造力要求比较高的文科、艺术等领網域,AI 已经有很好的表现,它的泛化能力也非常强,但如果希望它能解决一些很实际复杂的技术问题、商业问题,我们仍然需要等待‘系统 2 ’的到来。"
AI 目前正处于互联网的 " 雅虎时刻 ",甚至还没有发展到 " 谷歌崛起 "。OpenAI Sora 这样的明星产品固然能让人提振信心,但商业落地问题是全行业都要面对的问题:
目前人们已经能与 AI 展开对话、通过 AI 生成文本、影像、甚至高质量的视频,但问题在于,这些生成能力目前还处在较低水平,Sora 还不够多,当幻觉与新鲜感散去,在 C 端难做突破的大模型们,该去哪里实现自己的价值?
B 端是较为实际的出路。
这也是李可佳口中的 " 系统 2" 发展方向,通过理性、高效的 AI 为商务、工业提供助力,从而深刻改变整个产业,这也是大模型商业落地最实际的方向。但另一个事实是,通用大模型往往不能很高效快速地适配于企业的需要。
于是,大模型产业走向垂直化、细分化、专业化,已经成为了未来最重要的趋势之一。
无论是 GPT 还是其他基于 Transformer 架构下的大模型产品,其生成反馈的原则都并非线性的逻辑思考,而是根据 " 学到的知识和规律 " 来进行概率组合,这也是为何大模型学的越多越强悍的原因。
通用大模型的问题就是,它学习的主要是通用的、可公开的知识数据,针对拥有信息壁垒的产业领網域,通用大模型很难发挥作用。
这也是目前国内外许多厂商在做的。在教育、政企服务、医疗等领網域,许多大模型都开始了走向垂直化,包括网易的子曰教育大模型、专注政企客户的雅意大模型、在金融、医疗等领網域深耕的百川大模型等。
通过小而精的训练方法,不仅能够突破大模型无法解决专业问题的阻碍,还能进一步降低成本,让大规模推广成为可能。
" 以前很多人都认为,只要模型的规模够大,过了多少亿参数,模型就能达到很强的能力,但其实其对于任务的理解能力还是比较浅显的。"
在 2023 年底,雅意 2.0 大模型发布时,中科闻歌董事长王磊曾向刺猬公社表示,在他看来,垂直专业才是大模型发展的未来方向,雅意 2.0 大模型也同样遵循了这样一个方向,不再一味的追求规模与 C 端反馈,而是选择摒弃娱乐向的内容,将更多专业知识数据融入训练中,从而实现更好的政企服务。
那么有哪些产业能够更快的实现 " 大模型化 " 呢?
李可佳认为这主要看行业的容错率与专业度。在智慧教育领網域的多年深耕让他认识到,在容错率相对较高、对专业精准要求相对较低的领網域,AI 带来的变革将更容易发生。" 在拍搜、语言学习这些领網域,大模型带来的效率提升是非常显著的。"
他认为,医疗、金融等领網域也正在产生变革,伴随着大模型能力的不断进化,更多工业、科技领網域的生产制造都会迎来一场 AI 改造。
AI Agent:突破 AI 需求困境
那么如何将大模型的能力更直接的运用到我们的生产过程中?AI Agent 或许是一种更现实的路径。
" 可以这样构想一下,我还在做别的工作或是休息,在一个类似元宇宙的空间里,我的 AI Agent(代理)与另外一位创业者的 AI Agent 相遇,它们聊的很开心,或许等我醒过来,我的 AI Agent 就拿着对方的商业计划书来给我看了。"
AI Agent 在未来将成为人与 AI 大模型连接的工具,成为 AI 领網域继 GPT、文心一言等大模型产品的下一个热点,正在被越来越多人所认同。
一位 AI 从业者向刺猬公社表示,AI Agent 不仅仅会成为便利工作生活的工具,还能真正推动大模型从 B 端到 C 端的实际落地,推动 AI 产业的商业化成熟。
换言之,AI Agent 是 AI 产品更成熟的形态,它真正的使命就在于将 AI 能力封装化,让 C 端、B 端用户都能更便捷更直观的运用,从而助力生产力的解放。如果说大模型产品只能被动的接收 - 生成,那么 Agent 的使命要复杂的多,它更类似智能助手,需要借助自身的 AI 能力帮助使用者解决切实问题。
" 其实这是一种 AI native 的认知。" 李可佳表示,不同于很多企业 +AI 的思维,Agent 事实上是一种 AI+ 的逻辑。
" 面对 AI 浪潮,我们不能只去想如何利用 AI 能力加持我们已有的业务形式。我就认识很多创业者,希望通过大模型提升自己的 Saas 服务能力,比如做一个邮件营销的生成式 AI 产品等等,但他们却忽略了一点,以后有些 SaaS 类产品可能都直接 autopilot 了,这个产品对应的环节可能都没了。"
Agent 的意义就在于,它正在改变着人机协作的逻辑:
不仅仅是协助工作,AI 就可以独自帮助使用者完成任务,它不需要事实的提示词输入,也不需要使用者一步步的繁杂操作,只需要一个指令,Agent 就能帮你完成很多在过去时代无比复杂的工作,比如数据分析、广告营销投放、甚至是社交、销售这样主观性很强的工作。
这几乎是革命性的,在 Agent 日渐成熟的情况下,很多行业的许多环节都能够被改写,甚至取代。
GPTs 就是 OpenAI 针对 Agent 概念推出的产品之一,定制化的 GPT 机器人、能够满足不同的使用需要、专注于不同的领網域,GPTs 的推出一度让全球 Agent 企业大感危机。
目前来看,GPTs 似乎还没有达到 Agent 的程度,对于国内外的许多 AI 企业来说,机会仍然存在。
但 Agent 不是更智能的 AI 聊天机器人,其最主要的能力是主动调用 AI 工具,为使用者解决问题,想要实现这样的能力,除了技术能力外,与 Agent 背后的大模型基底息息相关,比如多模态的输入输出能力、幻觉问题、多轮互動的高效靠谱,都将影响 Agent 的表现。
更重要的是,Agent 的应用往往要与不同的产业领網域、应用场景相结合,这就与前面提到的垂直化趋势深度相关。
现如今国内也已经出现了很多垂直领網域的 Agent 产品,百度研发的营销 Agent 轻舸、钉钉、飞书的 AI 办公助理,这些企业从自身已有的产品和业务优势出发,希望借助 Agent 创造新的产品逻辑,从而实现产品的二次成长。
以钉钉的 AI Agent 为例,其 AI 助理可以与钉钉本身 " 融为一体 ",根据用户的指令,与平台上的应用和第三方插件、企业自建应用等结合,对这些功能进行调用。这样一来,也让钉钉庞大的插件和应用库变得简单易用,用户不再需要一个个找应用,AI 助理就可以做到更符合用户使用场景的匹配。
类似钉钉 AI 助理这样的产品,正在解决大模型的 " 伪需求 " 困境,带有强烈的 "AI native" 思维。当更好用、更有效的 Agent 产品被用户看见、使用,甚至解决工作生活中的种种痛点,大模型的商业落地难题也终将得到解决。
从娱乐需求,到更广阔的世界
现如今整个产业到底还面临着哪些问题?
最重要的仍是技术能力问题。" 如果从创业的角度出发来看,或许你在进行逻辑推演时,能够获得一个不错的推算结果,但真正重要的还是能否让用户感受到‘神奇时刻’。"李可佳表示。
对于大模型产品来说,最重要的仍旧是通过技术解决用户需求的能力,自 ChatGPT 横空出世以来,无数人都认为大模型产品将改变整个互联网的生产逻辑,但未来的进程似乎要远慢于我们的期望。
归根结底,是大多数大模型产品的能力远没有达到 " 神奇时刻 ",简单的多轮对话或许能为用户带来一刻的惊艳,但缺乏实际解决问题的能力。
" 质量信号没有达到效果,还要看数量信号,也就是用户的留存情况。" 这也与产品的实用性相关,GPT 能够在全球席卷上亿用户,除了出类拔萃的能力外,优质的互動体验,不断推出的多模态生成产品,都是关键因素。
有 Sora 这样的杀手级应用,OpenAI 自然不会为用户、商业化发愁,但对于其他玩家来说,除了在研发上下苦功外,垂直专业化、加强体验、创建多元应用场景就成为了重要的路径。
除此之外,抛开大模型产品、Agent 等固有思路,大模型还有许多新的机会。
作为早期投资市场的布局者,李可佳和所在的初心资本的投资逻辑可以概括为 " 两横三纵 ",在这样一个坐标图谱中,蕴含着初心观察到的产业机会。
" 两横分别是人才红利和供应链红利,在过去十几年中国移动互联网的飞速发展之下,整个行业培养了大量的工程师、科研人员,在全球都有着不少的优势,另一方面,中国在制造业上拥有很强的优势,尤其是在 3C 硬體等领網域,我们的制造业供应链相当完备。"
以这样两个红利为基础,三纵则代表了几个重要的技术变量,第一就是生成式 AI,其余两纵则为算力的性能跃迁和电动化到智能化的变迁。三纵与两横之间的许多交叉点则蕴含着新的机会,例如 AI+ 硬體、AI+ 元宇宙、AI+XR 等可能,都正被深切关注着。
在海外,Rabbit R1 等 AI Pin 硬體令人关注,而在国内,荣耀、OPPO 等厂商相继推出 AI 产品、AI 手机等,希望实现弯道超车;在 XR 领網域,万众瞩目的 Vision Pro 同样与 AI 有着千丝万缕的联系,在 AI 大模型的支持下,新的世界图景正在逐渐展开。
但最重要的仍旧是 AI native 思维。
" 最让我感觉兴奋的是,在硅谷这些地方,我们接触到了很多非常年轻的创业者,他们从不怀疑 AI 能否改变世界,他们的创业项目,都是基于 AI 时代已经到来的前提下开展的。" 李可佳向我们回忆,而这些 AI native 思维加持下的创业者,也让他真正看到了未来的图景。
" 新的技术正在改变世界的每个角落,如果沉溺在旧世界里,很可能会被时代抛弃。"
商务合作联系微信号 |yunlugong
如需和我们交流可后台回复 " 进群 " 加社群