大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

股价久违飙涨,商汤要用自己的Scaling law挑战GPT4

2024-04-25 简体 HK SG TW

今天小编分享的互联网经验:股价久违飙涨,商汤要用自己的Scaling law挑战GPT4,欢迎阅读。

4 月 24 日,商汤集团在港交所暂停交易,暂停交易前上涨 31.15%。商汤集团回应," 昨日日日新大模型 5.0 发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告。"

就在前一天的 "2024 年商汤技术交流日 " 上,商汤发布了对标 GPT4-Turbo 的大模型日日新大模型 SenseNova 5.0,追赶 GPT4 可能是当下中国大模型行业的集体目标。商汤在上海商汤临港 AIDC 举行的 "2024 年商汤技术交流日 " 上,交出了自己的答卷。

商汤版本的 Scaling Law

不是 GPT-4-1106-preview,不是 GPT-4-0125-preview,而是在一众大模型榜单中都高居榜首的 GPT4-Turbo。从 SenseNova 4.0 超 GPT-3.5,到 SenseNova5.0 全面对标 GPT-4 Turbo,商汤用了不到三个月时间。

这背后没有魔法,而是大语言模型中的第一性原理:尺度定律(Scaling laws)在起作用。

首先,随着数据、模型和算力规模的不断提升,商汤能够不断提升大模型的能力。这也是 OpenAI 所强调的模型性能与模型大小、数据量和计算量之间的幂律关系,是一个更为通用的性能提升框架。

但大模型并非单纯的暴力美学,背后是大量的軟體工程系统问题。商汤在遵循尺度定律的前提下,通过科学试验得到数学公式,做到了能够预测下一代大模型的性能,而不是盲目的随机尝试。

商汤科技董事长兼 CEO 徐立总结了两个假设条件:

第一,可预测性:可以跨越 5-7 个数量级尺度依然保持对性能的准确预测。

第二,保序性:在小尺度上验证了性能优劣,在更大尺度上依然保持。

这指导着商汤在有限的研发资源上找到最优的模型架构和数据配方,从而让模型能够更高效地完成学习的过程。" 我们在很早时间就预测到我们的模型可以在一定测试级上超越 GPT-4 的能力。"

也就是说,商汤在大模型的研发过程中,注重通过小规模实验来预测和验证模型架构和数据配方的有效性,并确保这些在小规模上得到验证的结论能够在更大规模上得到保持和应用。

" 如果我们选择更佳的数据配方性能提升效率会更大。" 基于商汤的实验结果,小模型在优化数据的情况下,也可以性能逼近甚至超越跨数量级的大模型。例如,Llama 3 小模型跨越了一个数量级领先于 Llama 2 更大尺寸的模型。

随之而来的一个问题是,更好的数据集在哪里?数据集质量如何提升?

据徐立介绍,SenseNova 5.0 采用了 10T+tokens 中英文预训练数据,通过精细设计的清洗处理,形成高质量的基础数据,解决大模型对客观知识和世界的初级认知。

除此之外,商汤还合成构造了思维链数据,预训练过程中大规模采用逻辑合成数据(数千亿 tokens 量级),从而提升模型推理、数学和编程能力。这本质上是在帮助大模型学习人类解决问题的思路和方法。

" 这是真正意义上保障模型能力提升的关键。如果每一个行业思维链数据都能够被轻松构造的话,我们在行业里面的推理能力就会大幅度提升 "。

尺度定律也存在物理极限,比如没有数据,比如硬體连接的极限。在今年 3 月份的时候,微软工程师就提到 OpenAI 如果在同一个州部署超过 10 万张 H100 GPU,电网就会崩溃。徐立表示," 这需要对这些卡、这些连接、这些拓扑进行新的设计,算法设计和算力设施需要联合优化。"

文生视频在路上

Llama3 8B 和 70B 版本的发布,让我们看到小参数大模型在端侧场景的潜力。商汤此次也推出的 1.8B 参数的 SenseChat-Lite,在主流评测中,超过了所有开源 2B 的同级别模型并且跨级领先了 LLaMA2 等 7B、13B 模型。

通过端云协同解决方案,SenseChat-Lite 可在中端平台实现 18.3 字 /s 的平均生成速度,旗舰平台可达到了 78.3 字 /s。

在端侧的多模态方面,扩散模型同样可在端侧实现业内最快的推理速度,商汤端侧 LDM-AI 扩图技术在某主流平台上,推理速度小于 1.5 秒,支持输出 1200 万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等影像编辑功能。

商汤针对端侧业务的 SDK 也正式发布,涵盖了日常对话、常识问答、文案生成、相册管理、图片生成、图片扩展等场景,支持全系列高通 8 系列、7 系列的芯片,以及 MTK 天玑芯片,适配手机终端、平板电腦、VR 眼镜、车载终端。

针对金融、代码、医疗、政务等行业面临的数据私有化部署需求,商汤推出了企业级大模型一体机。可同时支持企业级千亿模型加速和知识检索硬體加速,实现本地化部署,开箱即用,同时完成了国产化芯片的适配。支持最多 2P FLOPS 的算力,256G 的显存,448 GB/s 的连接。

面向軟體开发,商汤发布了小浣熊代码大模型一体机轻量版,帮助企业开发人员更高效地编写、理解和维护代码,其在 HumanEval 的测试通过率达到了 75.6%,超过 GPT-4 的 74.4%,能够支持 90 多种编程语言和 8K 上下文,单机可满足 100 人以内的团队应用需求。成本可从调用云端代码服务的每人每天 7-8 元,降低到每人每天 4.5 元。小浣熊代码大模型一体机轻量版的售价为每台 35 万元。

此外,商汤还发布了基于昇腾原生的行业大模型,与华为昇腾共同打造面向金融、医疗、政务、代码等大模型产业生态。

在最后环节,徐立还留了个 " 彩蛋 ":发了三段完全由大模型生成的视频,并表示短时间会发布文生视频平台。这也让人开始想象,追上 GPT-4 之后,在视觉领網域积累深厚的商汤,下一个目标是追上 Sora 吗?

一场 " 快鱼吃慢鱼 " 的游戏

除了日日新 SenseNova 5.0 更新后对标 GPT-4 Turbo 以及端侧和边侧产品的发布,商汤这次技术交流日的另一个关键词是 " 伙伴 "。

商汤邀请了邀请了华为昇腾计算业务总裁张迪煊、金山办公 CEO 章庆元、海通证券副总经理兼首席信息官毛宇星、小米集团小爱总经理王刚、阅文集团筑梦岛总经理葛文兵等生态伙伴嘉宾分享。共同探讨和交流大模型技术在办公、金融、出行等不同领網域的应用及前景。

这除了体现商汤大模型能力在不同领網域的应用潜力,实际上也是在外界传达了其商汤未来进一步深化行业合作的愿景。追上 GPT4 之后,真正比拼的可能是应用落地能力,在这一点上,商汤需要更多的伙伴。

无论是联合华为发布基于昇腾原生的行业大模型,还是端侧 SDK 的发布,我们可以看到商汤一直在强调行业合作伙伴的重要性,这也体现在与合作伙伴的细节中当中:

华为昇腾计算业务总裁张迪煊表示,商汤在今年三月初的加入昇腾的原生计划,时隔一个多月已经发布四款行业大模型。

小米集团小爱总经理王刚则提到,商汤曾在两三天内完成了的小米汽车的优化需求,并成功通过雷军验收。

" 快 " 的背后是持续对生成式 AI 业务的投入,早在 2021 年,商汤就开始构建自己的 AI 基础设施 SenseCore 商汤 AI 大装置,AIDC 是商汤重要算力基座,也在 2022 年 1 月 24 日正式启动运营,业绩公告显示,商汤大装置总算力已达到 12000petaFLOPS,相较于 2023 年初提高了一倍,GPU 数量达到 45000 卡,实现了万卡万参的大模型训练能力。

自 2023 年 3 月宣布战略聚焦 AGI 以来,商汤更是以季度为部門更新基础大模型及解决方案。到 SenseNova5.0 追上 GPT-4 之后股票涨停,市场的逻辑很清晰,短时间内现金流充足,追上 OpenAI 目前最新的模型之后可以讲更大的故事,加上足够低的价格,自然会有更多人用脚投票。

" 快 " 的结果落在商汤生成式 AI 业务的快速增长上,根据商汤科技最新发布的 2023 年财报显示,其生成式 AI 收入业务收入达 12 亿元取得了 200% 的大增长,占公司总收入的 35%。这也是商汤成立十年以来,以最快速度取得超过 10 亿收入的新业务。

从 AI1.0 时代走过的商汤,作为重要的引领者,见证了中国人工智能产业的变迁。

在 AI2.0 时代,所有人似乎都成为了 OpenAI 的追赶者。这场围绕大模型的竞争,既是大鱼吃小鱼,也是快鱼吃慢鱼。OpenAI 的领先身位带来的是绝对的竞争优势,参与者们要摆脱这种追赶的状态,需要底层基础设施的成熟,也需要顶层设计的创新。 

对于商汤来说,只有在大模型商业化爆发前的黎明中跑得足够快,跑得足够久,才能够吃到第一波红利,在根本上解决掉亏损问题,从而回到它应得的位置。

公元前十六世纪,商汤通过一系列的军事行动和政治策略,推翻夏朝建立了商朝,后人将这一项变革称为 " 商汤革命 "。未来几年,生成式 AI 可能将会成为商汤最大的收入来源,这或许正是商汤所需要的那场革命。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們