大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科技

2024年,每一个大模型都躲不过容嬷嬷和紫薇

2024-10-19 简体 HK SG TW

今天小编分享的科技经验:2024年,每一个大模型都躲不过容嬷嬷和紫薇,欢迎阅读。

文|邓咏仪

编辑|苏建勋

连最积极搞 AI 的李彦宏,在这件事上也迟疑了。

" 百度不碰 Sora 类的视频生成方向。" 李彦宏在近期的 2024 年 Q3 总监会上说道。原因在于,10 年、20 年都可能难以商业化应用。

从 OpenAI Sora 横空出世,再到 6 月的快手可灵全量上线,视频生成成为 2024 年最火热的 AI 话题。

厂商们纷纷开始你追我赶。从 4 月至今,视频生产模型如同雨后春笋一般——除了快手、字节、阿里等大厂,头部大模型公司如智谱、MiniMax,以及生数科技、智象未来等垂类厂商,均发布了视频生成模型。

国内视频模型的涌现,也让 " 容嬷嬷和紫薇 " 的鬼畜形象再次翻红,她俩活在不同的视频模型 demo 和网友二创中,考验着不同模型的效果:

△图源:可灵,来自公开网络  

 

△图源:即梦 AI,智能涌现制图  

 

行业对 " 超级应用 " 的渴望溢于言表,甚至影响到了如今大模型的路线——到底做不做视频大模型,影响国内 " 大模型六小虎 "(智谱、月之暗面、MiniMax、百川智能、阶跃星辰、零一万物)走势的关键决策。

不过,对于做不做视频模型,国内大模型厂商仍未达成共识,而是抽成了截然不同的几派:

有厂商迅速跟进。7 月,智谱就推出了类 Sora 的视频生成模型 " 智谱清影 ";8 月,MiniMax 发布视频模型 Video-01。

而阶跃星辰发布新影像模型,也在今年 7 月的上海世界人工智能大会上,做了少量的视频生成尝试。

也有旗帜鲜明的反对者。" 百川不会做 Sora。" 今年 5 月,百川智能 CEO 王小川就在《智能涌现》的专访中就表示。他认为,Sora 并不在 AGI(通用人工智能),即提升模型智力水平的主线上。

也有在探索后暂缓的厂商。最受关注的月之暗面,6 月被媒体报道在海外试水两个新应用——角色扮演应用 Ohai,以及 AI 音乐 / 视频生成应用 Noisse。据《智能涌现》了解,这两个应用因为效果不达预期,后来并没有被单独立项,停留在试验阶段。

而在近期的 "Kimi 探索版 " 上线后,月之暗面还将发布多模态相关能力。不过,还不确定是否会有视频生成相关功能。

直到国庆前后,视频生成领網域迎来两位重磅玩家:9 月 24 日,字节跳动低调甩出了 Seaweed 和 Pixeldance 两款产品。

而紧接着的 10 月 5 日,Meta 放出的系列模型 Movie Gen,则又一次炸场。

△图注:2024 上半年,全球已涌现了不少视频模型和产品,在中国尤其热闹。

在语言模型迭代放缓的当下,视频生成模型似乎成了那个更有希望的 AI 应用新方向——大厂也还没形成垄断。对初创公司而言,这更是一次重要选择——到底要不要做 Sora?

分叉路,要选哪条?

首先需要厘清的一个概念是,大厂、创业公司如今普遍标配的 " 多模态能力 "(影像、语音等模态),以及类 Sora 的视频生成模型,并不是同样的东西。

" 多模态能力,相当于是让模型能够理解影像、音频、视频等形式,但还是基于大语言模型延伸的能力。" 一位大模型从业者对《智能涌现》分析," 将视频、图片、语音输入到大模型里,是基于大语言模型做‘理解’;但生成视频,则是依靠视频模型的能力。"

" 类 Sora" 产品所依靠的视频生成模型,借鉴了大语言模型(LLM)中 Transformer 架构等技术思路,但和大语言模型(LLM)是两种不同的事物。

这意味着,如果要做一个视频生成模型,相当于另起炉灶,从 0 到 1 重新搭模型。

可以肯定的是,要做视频生成模型,当前还注定是少数人的游戏。

再造一个 "Sora",成本高昂。

据 Meta 的数据,Movie Gen 用了 6144 张 H100 进行训练,视频模型参数达到 30B(300 亿)。在国内,拥有此等训练资源的厂商,本就不多。

而眼下,国内大模型厂商基本都已经上齐了多模态能力,至于是否做视频生成方向,还处于摇摆状态。

对拥有短视频相关业务的大厂,如抖音、快手等,视频生成是不能输的方向。据硅星人报道,对可灵的大力投入,一个重要动力是为了服务于快手的内容生态—— 2023 年,首次在快手发布短视频的创作者就有 1.38 亿。

另外,快手做可灵,也意在服务快手的电商生态,比如为 MCN、电商商家提供商品相关的 AI 内容生成衣务。

但对初创玩家来说,在 AI 应用方向不明朗的当下,大家都在忐忑地摸着石头过河。

有玩家早早坚定了自己选择的道路。一开始打定不做 Sora 的百川,在 2024 年全力落地医疗场景,并推出了自己的医疗 AI 助手。

专门做视频生成的垂类厂商,也拿到了阶段性的结果,比如生数科技旗下的 Vidu,在 8 月上线后,两个月内,VIdu 的月访问量就已经达到 552 万。

但能不能把新故事讲成自己的,还得看各家的真本事。视频生成领網域的技术路线尚未收敛,市面上的顶级视频生成模型几乎都选择了闭源。

这意味着,玩家们需要投入真金白银去试错——选什么技术路线和应用场景,才决定 AGI 大潮退去后,谁能真正留在岸上。

文本太卷,Agent 太远,视频生成刚刚好?

OpenAI 的 Sora 尚且没有放开使用,为什么视频生成如今成了国内的香饽饽?

以 GPT-4 作为参考标杆,国内头部的大模型厂商和大厂,在今年上半年都已慢慢接近 GPT-4 的水平,在 OpenAI 后续发布 GPT-4o 后,厂商也都陆续跟进了多模态能力。

但 GPT-5 迟迟未出,意味着在语言模型上,国内大模型的厂商基本难以拉开代际差距。

另一方面,大模型跑了一年多,其落地和商业化成果还未让市场信服。

在国内,大部分的 AI 应用方向都陷入叫好不叫座的困境。细数这两年火过的 AI 应用方向—— ChatBot/ 情感陪伴等类 ChatGPT 产品、文生图、AI 音乐、AI 搜索,都迅速陷入同质化竞争的局面。

以国内头部的 AI 应用举例,豆包、Kimi 等在今年上半年经历了激烈的投流竞争,用户数最高已达千万级别,但商业化情况并不理想。

不少从业者认为,应用难以商业化,很大程度要归结到文本模型迭代放缓,能力提升变慢。这也让一些更遥远的,能完成更多复杂任务的方向——比如 Agent(智能体),越发模糊。

《智能涌现》了解到的一个例证是,字节旗下的 AI 开发平台扣子的 Agent 业务,在今年就经历了一轮缩减。

而近期圈内热切讨论的放弃大模型的预训练阶段,意味着不少厂商要走下追求的牌桌,转向 AI 应用落地,继续活下去。

厂商们需要新故事,视频生成方向则刚好站在中间点:既有足够技术和开发壁垒,但壁垒不会高到玩家摸不着,前景也足够大。

" 语言模型的商业化就不提了,初创公司至少还要想象力。如果头部初创公司不转其他应用方向,就什么都没有,怎么撑起这么高的估值?" 一位从业者直言。

2023 年,不少做视频生成的创业者都对《智能涌现》表示,如今的视频生成领網域可类比处在 GPT-2 到 GPT3 阶段。这意味着比 ChatGPT 的效果稍稍略落后,比语言模型所处的发展阶段早很多。

但 Sora 发布后,视频生成领網域已经看到了 GPT-3.5 阶段的曙光。" 这个阶段意味着,让你看到这个赛道的巨大潜力,市场愿意投入。" 一位从业者对《智能涌现》表示。

共识摇摆的背后,源于赛道仍处发展早期,还有不少探索机会。比如,刚刚发布的 Meta Movie Gen。在 Transformer 架构基础上,使用了 Flow Matching(流匹配技术),这就与 Sora 的路线有很大不同,也意味着整个赛道的技术路线尚未收敛。

在国内,这个方向上也有得天独厚的短视频生态,视频生成方向的模型探索,也因此站在全球前沿。

6 月爆火的快手视频模型 " 可灵 ",就是典型例子——在大厂中,快手并不是 AI 人才、资源的制高点,但经历短短数月攻坚,快手可灵仅凭 20 多人的小团队,硬是在一众大模型厂商中闯出一条路,可灵凭借怀旧照片等一系列策划,热度一度传到大洋彼岸的硅谷。

△ Stability.ai 创始人转发可灵产品,评论 " 中国在 AI 上有着巨大优势 " 来源:X

并且,视频生成方向还处在早期,算力成本仍处高位,一旦开始商业化,付费已是必选项。

在海外,视频生成已经走出了不同路线——头部的视频厂商 Runway 和 Pika 都专注做 B 端的生产力工具,Runway 甚至已经打入好莱坞,达成了不少影视界的合作。在国内,可灵、Minimax 等厂商也早早开始了付费尝试。

归根结底,很少人愿意错过这个方向。毕竟,视频已经取代文字,成为互联网上流量占比最高的信息内容。据 Sandvine《2023 全球互联网现象报告》,2022 年全球互联网视频服务,就占到总流量的 65.93%。

随着视频生成技术不断成熟,这也许不会只是大厂的游戏。初创公司可以结合技术,以及巧妙的运营手段,快速闯出一条自己的道路。

△来源:Pika

硅谷视频生成明星初创 Pika,就摸到了不少流量密码:一出道,就选择先在开发者聚集的 Discord 运营,并且迅速获得 50 万用户。

到了今年 10 月,Pika 新发布的 1.5 模型中,还带来了更多社交运营玩法:内置了充气、融化、爆炸、捏揉、压扁等模板,引来全球网友 " 整活儿 ",伺服器甚至因为涌入的用户太多而崩溃——有网友就不禁回忆起当年:与早期的 TikTok 冷启动时期如出一辙。

本文来自微信公众号" 智能涌现 ",作者:邓咏仪,36 氪经授权发布。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們