商汤日日新大模型90天大更新！CEO现场整活，主打突破想象力 - 大酷樂

今天小编分享的科学经验：商汤日日新大模型90天大更新！CEO现场整活，主打突破想象力，欢迎阅读。

商汤 " 日日新 "AI 大模型，如其名，真的做到了日日新。

这不，从发布到现在，时隔仅仅 3 个月，商汤便正式宣布：

商汤日日新（SenseNova）大模型体系全面更新。

那么这个更新版本又有哪些优化？

话不多说，直接上结果。

例如基于日日新的千亿参数语言大模型商量 2.0（SenseChat），在三个全球权威测评基准中的表现，均超越了 ChatGPT：

△各大语言模型在 MMLU、AGIEval、C-Eval 三个评测基准中得分情况

除此之外，基于日日新的其它各大 AIGC 平台，这次也一口气也都来了个大更新：

秒画 3.0（SenseMirage）：参数量提升至 70 亿量级，实现专业摄影级图片细节刻画。

如影 2.0（SenseAvatar）：语音和口型流畅度提升 30% 以上，实现 4K 高清视频效果。

琼宇 2.0（SenseSpace）：空间重建效率提升 20%，渲染性能提升 50%。

格物 2.0（SenseThings）：渲染精度大幅提升，对物品纹理及材质的还原达到毫米级精细度。

在现场，商汤 CEO 徐立也拿着秒画 3.0 搞起了花活：

人没去 CVPR 2023 现场领奖（商汤斩获今年最佳论文），那就直接让秒画来生成。

不会弹吉他、不会画画，没关系，继续生成：

咱就是说，城会玩儿了。

那么全新更新的日日新，更多产品的具体表现如何？我们继续往下看。

不只是超越了 ChatGPT 这么简单让老子和孔子对话

整体来看，商量的模型基础能力在 2.0 版本有了大幅的提高，这点我们从上文提到的性能超越 ChatGPT 便可有直观感受。

在模型的体系方面，商汤除了推出商量 2.0（SenseChat XL）之外，还推出了一个商量 S 版（SenseChat S），也就是小模型版本。

徐立便在现场展示了用这两个模型展示了一波 " 孔子对话老子 " 的情景：

在语言方面，它新增了一些地区语言，例如阿拉伯语和粤语等；以及支持简体中文、繁体中文、英语等多种语言互動。

同样是这场 " 孔子对话老子 "，粤语版本是这样的：

同时，商量 2.0 还突破了大语言模型输入长度的限制。

例如给它一个指令：将超长的英文文本总结为中文概要，商量 2.0 便可立即执行这样复杂的任务。

不仅如此，用户还可以基于此进一步进行多轮对话：

最后，商量 2.0 还发布了一个 " 外挂 " ——知识库挂载：

无需训练模型，就可以快速融合知识生成；搭配企业知识库可以快速解决相关领網域问题。

生成摄影级影像，提示词可以自动补充了

在文生图方面，商汤的秒画更新到了 3.0 版本，从功能更新的内容上来看，主打的就是一个 " 突破想象力 "。

例如在轻量级方面，现在每个人都能通过拖拽的动作，在 10 分钟内微调模型，并且定制化个人专属的生成 AI。

我们在上面提到的徐立 " 搞花活 " 便是个很好的例子。

在" 智能化 "方面，根据提示词（prompt）来生成 AI 绘画作品不会再变得很繁琐，因为现在就连提示词都可以自动补充了。

以往我们想让 AI 生成一条龙，可能就会输入 " 中国龙 "、" 蓝色摆件 "、" 珠宝风格 "，但往往由于提示词过于简单，并不能达到特别精细的效果。

而现在，同样是只输入这三个短语，秒画 3.0 会自动对提示词做补充，然后生成更为惊艳的作品：

再来感受一下提示词 " 阳光下的塑料袋 "，在被自动扩充后的效果：

最后在效果方面，秒画 3.0 现在生成的影像，无论是成片水准还是细节与元素，都能够达到影视级的效果。

除了单打独斗的能力之外，当商量 2.0 和秒画 3.0 结合之后的多模态大模型，也衍生出了一种新玩法——热点事件理解。

在对话过程中 " 喂 " 它一张图片或视频，便可以看图说话，更加深入且精准的描述素材中的内容。

延参法师也 " 来现场 " 了

数字人方面的如影 2.0也是本次商汤产品大更新的重点。

这不，在现场商汤便展示了延参法师等知名人物的数字人效果，无论是声音（口音）亦或是神情，真的可以说是栩栩如生。

还有包括主持人张泉灵、经济学家任泽平、上交大教授季卫东等等，堪称上演了一出 " 百变大咖秀 "。

在语言方面，如影 2.0 打造的数字人在英语、日语、西班牙、阿拉伯语等多语种的精准度提升 30% 以上，而且口型和语音匹配得更加自然。

在生成效果方面，如影 2.0 支持实现影级 4K 高清视频的输出，可以让成片更加精良。

如影的更新也同样带来了一种新玩法——

现在，用户可以通过输入提示词自动生成与描述匹配的专属数字人形象了！

而且还是可以实现数字人歌唱功能的那种。

这便极大地降低了虚拟网红、数字人短片等内容生成的门槛。

无论 1 万平米还是 1 毫米都能 hold 住的 3D 重建

最后在 3D 重建、数字孪生领網域，商汤同样带来了大更新——琼宇 2.0和格物 2.0。

先来看下这样一个恢弘的场景：

如果不说这是琼宇 2.0 3D 重建的结果，或许很多小伙伴都会以为是航拍的视频了。

据了解，琼宇 2.0 目前已经实现了厘米级三维重建精度，室外每 1 万平米精度达 5 厘米，室内每 1000 平米精度达 1 厘米。

同时，重建效率提升 20%，渲染性能提升 50%，100 平方公里场景的建图时间仅需 38 小时即可完成（1200 TFLOPS/ 秒算力支持）。

除了这种宏观场景的 3D 重建之外，在微观层面上的 3D 重建能力，随着格物迭代到 2.0 版本也有了大幅提升——

对物品纹理及材质的还原达到毫米级精细度，能够带来更清晰、更真实的产品细节体验。

更重要的是，格物 2.0 还突破了高反光和镜面物体采集这种老大难的问题，是无需贴纸或标签，即可精确还原商品的外观和特征的那种。

不难看出，日日新大模型在步入 2.0 时代之后，各项 AIGC 平台的能力都有了显著的提升。

那么接下来的一个问题便是：

如何在 3 个月内做到的大更新？

早在三个月前，商汤站在 AGC 新时代下，围绕数据、算法和算力三要素给出了一个新公式：

计算量（GPU 数量 x 运行时间 x 并行效率）= 模型参数量 x 处理数据量。

我们先来看下等式右边的两个因素：

模型参数量要足够多，才能实现 AI 智慧的涌现，而这也带来了对算力的剧增，需要更高的并行效率，才能有效支持大参数模型训练。

数据方面，高质量自然语言数据逐渐稀缺，而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势，能够使得 AI 更好地理解世界。

二者的深度结合，便有了等式左边的计算量；而之于这两者，商汤有自己的一套 " 打法 " ——

大模型 + 大装置。

首先便是大模型方面，日日新虽然是商汤于数月前发布，但它并非是这一波 AIGC 热潮中一蹴而就的产物。

因为早于 5 年前，商汤便已经着手于此，而且在 2019 年便使用上千张 GPU 进行单任务训练，推出了 10 亿参数规模的视觉模型，算法效果达到了当时业界最佳。

在后来的 2021 年至 2022 年期间，商汤还训练并开源了 30 亿参数的多模态大模型" 书生 "。

因此，商汤能够迅速推出千亿参数大模型并实现版本迭代，可以视为是长期以来各种 " 小作业 " 的汇总而成的 " 大作业 "。

其次是在大装置方面，也就是商汤在大算力中的 " 打法 "，它与自身大模型的发展也有异曲同工之妙——同样也是早有布局。

在 2022 年 1 月，商汤交付使用了首付高达 56 亿元的人工智能计算中心（AIDC），而且是 " 出道 " 即成为亚洲最大的 AI 超算中心之一。

一年前它的算力就已经高达了 3740 Petaflops，可以轻松应对万亿参数的大模型；而时隔仅 1 年，这个数值便翻了一小番，达到了 5000 Petaflops。

这又是什么概念呢？

举个例子，在如此大装置的加持之下，它可以以最大 4000 卡规模集群进行单任务训练，并可做到七天以上不间断的稳定训练。

……

总而言之，有大数据、有大算力、有大模型，所以商汤能让日日新在 3 个月内完成版本迭代也就不难理解了。

但有一说一，这还是" 商汤速度 "的一隅而已。

大模型的落地也在提速

" 商汤速度 " 的另一面，正是体现在了落地应用上。

如果你认为日日新的全面更新只是一个 " 提出 " 和 " 宣布 " 的动作，那就大错特错了，因为它已经是 " 上岗 " 了的那种。

例如结合商量 2.0 和秒画 3.0 的能力，商汤在移动端给客户带来了多种互動方面的 " 解法 "。

针对信息获取的问答互動、生活场景的知识互動、语言和影像生成的内容互動等等，正因为商汤的大模型拥有轻量化版本，所以可以轻松在移动端上部署。

再如琼宇 2.0 为济南马山镇区網域开发、合肥中国视界园区、上海瑞金医院等真实线下场景，打造了相对应的数字孪生，使得运营效率得到了大幅提升。

商汤还通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案。

而且商汤产品的更新，并非是单打独斗的那种，而是强强联手出奇迹。

例如我们刚才提到的 " 热点事件理解 " 便是其中之一，除此之外，商汤在智能汽车领網域的绝影，更是融合了多个 " 看家本领 "。

例如多模态大模型（多模态感知）、语言大模型（车舱大腦）、知识融合（专属记忆模块）和 AIGC 大模型（定制数字人）等等。

也正如徐立在现场所述：

大模型的突破掀起了人工智能的新一轮技术革命，随之而来的是产业需求呈现爆炸式增长，全新的应用场景和应用模式正迅速涌现。

商汤希望通过‘大模型 + 大装置’持续推动 AI 基础设施能力的跃进提升，不仅打造通用能力更加强大的基础模型，也进一步高效融合不同垂直领網域的专业知识，构建更懂行业、更具专长的专业大模型，从根本上降低大模型的下游应用成本和门槛，让大模型的产业价值在千行百业中绽放。

总而言之，现在的大模型之战，不仅是拼技术迭代的速度，更是拼应用和落地的速度。

— 完 —

点这里关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

>