今天小编分享的科学经验:昆仑万维方汉:大模型的技术红利在消退,商业模式创新者将成赢家,欢迎阅读。
接下来,到底什么样的玩家才能吃上AI 大模型的红利?
诚如大家所看到的那样,即便是 OpenAI 这样的 " 顶流 " 刚发布了 Sora,也未能对其他视频生成模型造成碾压性的冲击。
但遥想最初 ChatGPT 发布之际,不仅在全球范围内掀起一股技术新浪潮,更是吃了足足一年半以上的技术红利。
因此,站在现在这个时间节点,刚才的问题是值得深入思考一番。
而就在前不久的 MEET 2025 智能未来大会中,昆仑万维董事长兼 CEO方汉便针对这个问题给出了他的答案:
AI 大模型 SOTA(State of the Art)的技术红利变得越来越短暂,也将逐渐消退。
AI 大模型产品需要关注 " 新 " 与 " 好 ",商业模式能够创新者将成为真正的赢家。
在现场,方汉基于昆仑万维自身发展和入局大模型多年的经验,以《智能边界:AI 大模型如何推动应用创新》为主题分享了他的所见所闻、所思所想。
MEET 2025 智能未来大会是由量子位主办的行业峰会,20 余位产业代表与会讨论。线下参会观众 1000+,线上直播观众 320 万 +,获得了主流媒体的广泛关注与报道。
核心观点梳理
用户不关心内容是否由 AI 制作,他们只关心内容是否新颖和优质。
技术红利逐渐缩短,AI 产品需要关注 " 新 " 与 " 好 ",以用户为导向实现商业价值。
AI 公司需要从单纯的工具提供者转变为平台型企业,通过产品和商业模式创新来实现这一转变。
中国企业在算法优化和商业模式创新上投入更多精力。
AIGC 技术能显著降低创作成本,使弱势文化国家也能创作高质量内容。
(为更好呈现方汉的观点,量子位在不改变原意的基础上做了如下梳理)
昆仑万维的 AI 大模型发展之道
各位尊敬的来宾,大家好,我是昆仑万维的方汉,今天我来跟大家分享一下,我们公司在 AI 大模型这一波浪潮中间,从技术到产品,我们的动作和我们对产品的思考。
首先简单介绍下我们公司。
昆仑万维公司 2008 年成立,主要在中国做网络游戏的研发,2015 年上市之后开始转型做出海互联网平台。
从 2015 年到 2020 年,主要是把国外老的互联网厂牌通过中国人强大的运营能力做大做强,其中包括全世界第三大浏览器 Opera,还有海外的 K 歌軟體 StarMaker 等,都取得了很好的成绩。
从 2020 年开始,我们开始做 AI 方向的大模型研发。2022 年 12 月,我们发布了国内开源的第一个 13B 的中文预训练大模型。
目前我们有三大业务板块,AGI 与 AIGC 业务、信息分发与元宇宙业务、投资业务。
我们在全球大概有 4 亿月活跃用户,海外收入占比 89.7%。在全世界 100 多个国家和地区都有业务,在 20 多个国家有我们的办公室。
下面介绍一下我们在 AI 领網域的布局。
我们从硬體算力层到模型层到应用层都有投入,其实我们最关注的还是模型层与应用层。
在模型层,我们有语言大模型、多模态大模型、3D 大模型、视频大模型、音乐大模型。
目前技术指标最好的是音乐大模型,这是国内目前唯一一家能够跟国外音乐大模型 Suno 相媲美的音乐生成大模型。
应用层,我们在 AI 助手、AI 游戏、AI 短剧、AI 音乐方面都有投入。
2022 年 12 月我们在开源了 13B 的中文预训练大模型之后,2023 年 4 月发布了一个千亿的天工 1.0 大模型。
2024 年 4 月,我们发布了天工 3.0,其中音乐大模型取得了行业 SOTA。
2024 年 11 月 20 日,我们发布了天工 4.0 4o 版和端到端的实时语音对话助手 Skyo;11 月 27 日,我们发布了天工 4.0 的推理版本 o1。
我们的天工 4.0 4o 版本,端到端实时语音对话系统,主要是把语音对话模型的时延从原来外挂式的 400 毫秒降到 100 毫秒,这个对于 C 端应用是至关重要的。
天工 4.0 o1 版本是国内第一款具有中文逻辑推理能力的 o1 模型,其中一个系列也马上要开源。
这是我们的业务矩阵,在国内主要做 AI 搜索业务,在海外有 AI 游戏、AI 音乐、AI 短剧和 AI 社交等业务。
我们国内的 AI 助手的产品也更新了,包括高级搜索、天工彩页和天工宝典。
天工高级 AI 搜索功能是目前最懂金融、学术的 AI 搜索。
这是 AI 短剧平台SkyReels,它是全球首个集成视频大模型与 3D 大模型的平台。
值得注意的是,Sora 已经正式对外发布了,但是你们可以看到,Sora 本身还是一个生成式模型。
国内的生成式模型有一个问题,用它来做实际作品的时候,要有一个很经典的动作,术语叫" 抽卡 ",就是同一个场景要用同一个 prompt 可能要生成 10 个甚至上百个视频,从中间抽出一个可用的视频。
也就是说,可控性是一个非常亟待解决的问题。我们走的路线是用 3D 大模型进行生成,再通过视频大模型进行转绘,这样可以做到一次成片,这个对于视频创作者来说把可控性大大提高了,不仅能够极大降低用户的使用成本,甚至还能极大地降低制作时间。
这是 AI 音乐。
AI 音乐的大模型使用的数据量将近 2000 万首训练数据,众所周知,人类有史以来总共才有 4000 万首音乐,我们大概用了一半的数据量。
目前我们在海外有面向 C 端的流媒体音乐平台 Melodio 和面向 B 端的创作平台Mureka。
此外,还有 AI 社交产品Linky,DAU 已经超过 50 万。
SOTA 技术红利将消退
下面是我们在做探索过程中的一些商业思考。
目前很明显 AI 大模型已经到了中场甚至下半场,企业选择何种商业模式来进行自己的产品研发和推广?这是一个很重要的问题。
首先,我觉得由于风险投资的差异,导致中美 AI 的创业环境的不同。
因为我们在海外做的业务非常多,现在全世界的 AI 创新企业只有中国和美国是最多的,但是中国的 AI 创业企业能够拿到的融资与美国同行相比,少非常多。
可以看到,海外 AI 创业公司还有一大部分在做基础架构,它们的 B 端应用,在医疗健康、法律、金融等方向比较多,中国企业反而可能 2C、2B 都比较多。
此外,Scaling Law 到底有没有放缓?争论点非常多。但我觉得能够看到一个很明显的事实。
为何 OpenAI 推出 4o?本质是因为训练的 Scaling Law 已经放缓了,但是通过慢思考推理的 Scaling Law 又继续涌现,所以你只要继续加大推理时间,模型能力就会上升,这是从产品角度倒推的一个事实。
SOTA 的红利变得越来越短暂。
GPT3.5 出来之后震惊全球,它的红利至少持续一年半以上,但是像 Sora 正式发布后,我看到很多评测对其提出了批评意见,比如,图生图做得比较差、人脸都生成不出来、文生图的可控性不好。
也就是说,Sora 在正式发布之后 , 并没有表现出对同类的其他一些视频生成模型的碾压式的技术优势,这样导致了 Sora 的技术红利能不能像 ChatGPT3.5 那样持续很长时间?或者像 Dalle3 那样压根没有吃到红利?
在文生图时代,做得最好的是 OpenAI 的 Dalle3,但是由于种种原因,最后市场上吃到红利的其实是 Midjourney 和 Stable Difussion。
我认为,Sora 有可能吃不到 SOTA 的红利。
中国的 AI 企业,除了拿不到更多投资,还存在一个问题,在算力上受到极大限制。我们能拿到硬體的算力是比较有限的。这样会倒逼两点。
首先,中国企业在算法迭代上有极大的动机和投入,例如,Sora 第一版本训练用了将近 5000 — 8000 张卡,到中国第一个可用的视频生成模型算力是花了不到 1000 张卡,最新的一个开源生成模型可能只花了 256 张卡。
中国团队在算法的优化和迭代上所花的精力应该是美国同行的很多倍,因为没有办法,没有卡,这就是所谓的以软补硬。
同时 , 中国企业还有一个巨大问题,生存压力特别大。一部分 AI 企业得不到更多资金,另一部分 AI 企业即便能拿到资金,投资人对企业盈利的时间点和商业模式都有极高要求,所以中国企业都在思考,用 AI 如何快速地盈利?
大家可以看到,现在在全球市场上疯狂买量的 AI 企业一定是中国企业,因为所有的中国企业都在拼命地打磨自己的产品的盈利模式,而不是像美国同行一样有充足的资金去做更深层的工作。
AIGC 技术能显著降低创作成本
下面跟大家分享一下,文化平权和多语言带来的蓝海。
还是以 Sora 发布为例,大家可以看到,Sora 有一篇 PR 稿件标题叫《尼日利亚的 Minna》,这是一个 KOL,他用 Sora 创造了一个质量很好的视频。
正巧我也在尼日利亚待过很长时间,据我了解,在尼日利亚拍摄一部电影的平均成本大概是 10 万美金,不到 100 万人民币,这样导致尼日利亚当地根本没有能力创造出与美国电影,不要说美国电影,甚至连印度电影都比不上的一个高质量的内容。
所以像尼日利亚这样的亚非拉国家,他们能看的电影只有美国大片,为什么?因为美国大片平均的制作成本在 1 亿美金以上。
那么,中国的大片什么时候能与美国大片正面 PK?何时赶上美国?中国的电影,票房上 10 亿之后、单部拍摄成本上亿之后,中国的电影才可以正面与美国电影 PK。
到《流浪地球》这个级别,它的视听效果与美国相比已经没有差别了。这一切本质上都是用资金换来的。全球其他国家如果没有这个资金,就只能看强势文化的电影。
但是有了 AIGC 之后,包括内容生成,我相信以后单部大片的投资,从 1 亿美金的制作成本很快可以降到几百万人民币,甚至几十万、几千元人民币,这都是非常有可能的。
这样的结果导致所有国家、所有弱势文化地区都可以用 AI 技术来制作本国的内容。
与 TikTok 一样,全世界人民都是用手机创作属于自己的内容文化。我们认为 AIGC 技术的进步会极大降低所有人创作内容的门槛和所有人创作内容的成本。
这样全球创作者的规模,包括电影创作者、音乐创作者、电视创作者、短剧创作者都会急剧扩大,这对中国平台型企业而言一定是非常大的优势,这个过程中也会涌现下一代内容平台。
大家知道,去年 AI 公司里薪酬最高的是算法工程师,这个与我们最早进入互联网时代的时候一模一样,1995 年一个程式员会写 HTML,每个月可以挣一辆奥迪出来。
但是今天一个程式员只会 HTML,每个月连一个车轮子都挣不出来,这就是技术的迅速弱化。
中国互联网最后真正赚到钱或者成长为巨头的企业,大部分都是靠商业模式创新取得了成功。
对于用户,他们根本不关心你的内容是 AI 做的还是人做的,只关心两个点,内容要么新,要么好。
例如,众所周知《黑神话》,这个游戏的质量非常高,花了几亿元人民币的成本、工业化的生产,创造出全世界一流的内容,这就是 " 好 "。
对于其他没有这么多资金投入的企业来说,你的内容用户怎么会买单?那就要 " 新 "。
再举一个例子,同样是游戏领網域,像重庆有一家公司,5 个人,100 多万投入,最后做了一个戴森球计划 , 卖了 8 亿,就是在内容的形式上进行了创新。
我认为,对于 AI 产品来说,你只要关注你产品的形态是 " 新 " 还是 " 好 ",这样用户才会买单。
对于大多数 AI 创业企业来说,产品形式上的创新才是击中用户的根本点,而不是说是不是 AI、AI 用了百分之多少。
对于所有 AI 创业企业来说,当下都处在比技术、比指标的阶段。我觉得绝大多数 AI 产品都是偏工具类的軟體。在打造工具类产品时,一定要思考整个产品的宗旨是什么。
例如,在手机刚刚出现的时候,有很多企业做了很多视频工具、美颜工具,其中有一家做工具类产品的公司,最后成长为中国的一个短视频的巨头,他的产品叫 "GIF 快手 ",就是把视频可以转成动画 Gif,好在论坛上、聊天上去传播。
对于今天的所有 AI 公司来说,我们现在做的都是工具,但我们一定要想,我们的工具怎么样通过产品模式和商业模式的创新,成为真正的平台型企业,而不是一辈子做一个工具。
基本上对于所有 AI 公司都一样,要么去卷通用人工智能,要么通过 AIGC 为消费者创作更好的内容,让消费者可以通过 AI 降低创作内容的门槛和创作内容的成本,更好地塑造和表达自我。
我也希望在座所有企业家和从业者能够在 AI 时代大潮中抓住自己的时代红利。
谢谢大家!
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>