大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

2025-04-11 简体 HK SG TW

今天小编分享的科学经验:刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理,欢迎阅读。

不得了。

现在的国产 AI 应用,一口气看好几分钟的视频,都可以直接做推理和解析了!

瞧 ~ 只需 " 喂 " 上一段柯南片段,AI 就摇身一变成 " 名侦探 " 做剖析:

它会对整个视频的内容先做一个总结,再按照秒级,对视频片段做内容上的推演。

如果再给这个 AI" 喂 " 上一段足球游戏,它又会秒变成一位资深解说员:

这一次,在视频总结和视频要点之后,我们继续提出要求:

请帮我剪辑视频中的片段,包含任意由客户指定的场景,提取相关片段,标明时间范围,并为每个片段配上解说文案,用户场景为:进球时刻。

它就会立即执行深度思考,自动剪辑出一段 8 秒的高光片段,并附上建议搭配的音乐或音效:

这便是商汤最新更新的日日新 SenseNova V6解锁的新能力——

原生多模态通用大模型,采用6000 亿参数 MoE 架构,实现文本、影像和视频的原生融合。

从性能评测来看,SenseNova V6 已经在纯文本任务和多模态任务中,多项指标均已超越 GPT-4.5、Gemini 2.0 Pro,并全面超越 DeepSeek V3:

在强推理能力上,日日新 V6/V6 Reasoner 的多模态和语言深度推理任务上同时超过了 OpenAI 的 o1 和 Gemini 2.0 flash-thinking 的水平。

同时在小版本的模型上,SenseNova V6 的各项成绩也超越 GPT-4o:

纵观整体,可以将商汤此次发布新模型的特点总结为三个关键词——

强推理、强互動和长记忆。

那么具体效果如何,我们继续往下看。

边看边听边理解的 AI

这次我们的实测主要聚焦在实时音视频互動的能力上。

我们直接用全新版本的商量 APP(内测版)来做一波测试。

测试的视频,便是最近大火的韩剧《苦尽柑来遇见你》中女主妈妈让婆婆陪她一起去拍遗像的片段:

AI 在看了整整五分钟视频之后,对于我们的三连问都给出了精准的答案:

你觉得刚才这两位女士是什么关系?

你觉得这两个女士为什么要去照相馆照相?

画面中这位女士最后的结果是怎么样的?

不仅如此啊,从 AI 的回复中,我们也可以听出情绪上的变化,对于这样令无数人催泪的桥段,它作答的情绪也是略带 sad。

再来一个比较有意思的——看图猜城市:

AI 的回答如下:

在一番深度思考之后,AI 是精准猜到了长沙这个城市。

类似的,我们再来做一个猜成语的游戏,题目长这样:

这一次,AI 更是没有过多的 " 废话 ",直击要害地给出了答案——缘木求鱼。

不光是有趣,在面对日常生活中的问题,商汤 SenseNova V6 更是能够体现它有用的价值。

比如给小朋友辅导数学题,现在真的就是一拍一问就可以的事情了。

要知道,普通大模型只会提供千篇一律的标准答案,无法基于不同的解题思路提供指导。

但日日新 V6 不但能识别手写体,还能够提供针对错误点的一对一引导式讲解,并给与高效辅导:

从多种维度的实测来看,SenseNova V6 是具备了高度拟人化的感知、表达和情感理解能力,可针对不同的对话内容和场景需求,即时灵活地切换语气、情感与音调。

同时,它还拥有较强的实时互動、视觉识别、记忆思考、持续对话和复杂推理等能力。

除此之外,商汤的 SenseNova V6,还上身了今年持续爆火的具身智能,可以说是用它多模态的能力,给机器人装上大腦、眼睛、耳朵和嘴巴:

怎么做到的?

看完各种实测,我们再来聊聊 SenseNova V6 背后的原理。

为了更好地理解,量子位与商汤科技联合创始人、执行董事及人工智能基础设施和大模型首席科学家林达华请教了一番。

首先,就是商汤自研的原生多模态融合训练技术。

这是一种能够将多种模态信息(如文本、影像、视频、音频等)在模型架构和训练过程中进行深度融合的 AI 模型架构。

与传统的将语言模型和多模态模型分立的方式不同,它通过桥接技术(如补充训练数据和模态关联机制)实现模态间的协同,避免传统方法中 " 跷跷板效应 "(即增强某一模态能力导致另一模态能力下降)。

这种设计能更自然处理复杂场景(如漫画理解、视频分析),捕捉跨模态的细节关联(如影像中的隐含信息)。

在今年 1 月份的权威评测榜单 SuperCLUE(语言模型综合榜单)和 OpenCompass(多模态综合榜单)上均位列国内第一,这也充分证明了该技术的强大潜力。

其次,是多模态长思维链合成技术。

面对复杂推理任务,传统 AI 模型容易因信息过长而丢失关键逻辑;商汤的这一技术可以通过多智能体协作,实现超长思维链的生成与验证(目前储备超 1000 万条思维链数据)。

具体而言,它可以合成并理解 64K tokens(约 5 万字)的多模态长思维链,使模型具备长时间、多步骤的深度思考能力,适用于数学推导、科学分析、长文档理解等场景。

林达华举例说明,模型在回答问题时能逐步关联影像细节(如漫画中的海鸥表情),最终生成富有创造力的输出。

除此之外,还有多模态混合增强学习。

这一技术的提出主要是为了平衡模型的逻辑推理能力和情感表达能力。

它同时采用基于人类偏好的 RLHF(强化学习人类反馈)和基于确定性答案的 RFT(强化学习事实训练),使模型既符合人类喜好,又保证事实准确性。

并且通过智能权重调整,确保模型在提升推理能力的同时,不会变得机械生硬,仍能自然表达情感。

最后,便是长视频统一表征和动态压缩。

长视频理解一直是 AI 的难题,商汤的统一时序表征技术实现了跨模态信息的高效对齐与压缩。

它可以将画面(视觉)、语音(听觉)、字幕(文本)、时间逻辑统一编码,形成连贯的时序表征。

在采用细粒度级联压缩 + 内容敏感过滤之后,10 分钟的长视频可压缩至 16K tokens(仅为原始数据的极小部分),同时保留核心语义,大幅提升处理效率。

以上四大技术,便是商汤 SenseNova V6 背后的杀手锏了。

不仅要日日新,还要天天用

遥想百模大战之初,商汤 CEO 徐立博士解释过为何商汤大模型会取名为 " 日日新 ":

灵感源自中国古代经典《礼记 · 大学》中的名句" 苟日新,日日新,又日新 "。

其本意是如果一天能够自新,就该天天自新,持续不断地革新;这也意味着商汤的大模型版本会持续更新,能力 " 日新月异 "。

现在回头来看,从 SenseNova V1 到现在的 V6,商汤大模型发展速度确实是做到这一点:平均 3-4 个月便会有一次的迭代。

而从今天的发布会来看,不论是从技术的解读,亦或是案例、demo 的分享,无不在剑指易用性。

大到城市管理、物业运营、电网巡检,小到数学解题、游戏解说、绘本故事……

一言蔽之,商汤在透露的核心观点便是:

AI 之道,在于百姓之日用。

对此,徐立博士也对量子位做了更进一步的阐述:

推理能力、多模态能力、模型融合能力,让 AI 的通用智能大大泛化,不光能推进科学探索,也能解决老百姓的日常痛点和所需。

核心还是 AI 通用能力的实现,我认为当下正是多模态智能的涌现期。

除此之外,借着此次 SenseNova V6" 上身 " 具身智能,还延伸出了一个有趣的话题——

前不久某知名创投圈大佬一句 " 批量退出具身智能 " 引发了不小热议。

对此,商汤科技联合创始人杨帆认为:

这种观点很好,科技创新产业需要这种质疑,我们需要直面且客服这种质疑,才能迈向更认真严肃的产业阶段。

具身智能可能还是试验阶段的东西,但我个人非常有信心,能跟合作伙伴一起为产业提供更多的价值。

银河通用合伙人、大模型负责人张直政表示:

有不同讨论声音的时候,说明大家真的在严肃的讨论这个问题;但这并不意味着具身智能的泡沫有多严重,这是科技创新的驱动力。

我作为科研人员,从谨慎乐观的角度来看,泡沫对于创新是非常正常的。

例如骑马的时候,对汽车就是泡沫;是对技术的想象力和边界产生了突破,我们要从宏观的需求出发,把这个技术落实下进去,把对前沿科技的想象变成真正的产品。

除此之外,上海交通大学副教授闫维新对这个问题的看法是:

泡沫是远离了价值以外的内容,只要大方向正确,与之相关的应用、落地的发展中过程中,我们需要冷静思考,是否能够像人一样有感知力和执行力去满足公众需求。

我认为危险替代就是具身智能一个非常好的场景,3-5 年后是可以看到的。

总而言之,商汤作为国内大模型代表性玩家,它今天所强调的 "AI 之道 ",一来是符合当今大模型发展 " 应用为王 " 的趋势,更是反应出了 AI 发展的根本价值取向——

技术必须服务于人的真实需求,融入日常生活,解决实际问题。

那么今天,你用 AI 了吗?赶快去试试 SenseNova V6 吧 ~

chat.sensetime.com   

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  完  —

点亮星标

科技前沿进展每日见

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們