大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

最神秘国产大模型团队冒泡,一出手就是万亿参数MoE,两款应用敞开玩

2024-04-01 简体 HK SG TW

今天小编分享的科学经验:最神秘国产大模型团队冒泡,一出手就是万亿参数MoE,两款应用敞开玩,欢迎阅读。

国内基础大模型创业公司,最后一位强实力选手终于正式来到台前。

它就是微软前全球副总裁姜大昕所创办的阶跃星辰。

一年前,量子位就对这位大牛的创业动向有所耳闻。

姜大昕在微软工作 16 年有余,曾任职微软全球副总裁,微软亚洲互联网工程院(STCA)首席科学家,全面负责微软必应搜索的技术研发工作。但就是这么一位风云人物,此番创业,却有不少令人费解的动作。

一来,他在微软职级极高,在微软混得风生水起,怎么想不开创业?

二来,阶跃星辰已经成立一年,但在百模群战的 2023 年,这家公司低调得近乎隐形。不仅没有主动对外发声,连量子位在圈内打听消息也探不得虚实。

现如今,大模型五虎已经初成格局,市场的注意力已经被瓜分不少,阶跃星辰的亮相才姗姗来迟——会不会晚了?

会者不晚。

一出手,阶跃星辰就亮出了自己蛰伏水下一年沉淀的成绩:

千亿模型有了,ToC 产品有了,万亿模型在路上,且通往 AGI 的路也十分明确:

走一条" 单模态—多模态—多模理解和生成的统一—世界模型— AGI(通用人工智能)"的路。

2 款 C 端产品全面开放使用

阶跃星辰的产品是什么?

不玩虚的,一露面,阶跃星辰就直接带来了 2 款面向 C 端市场的应用:

跃问和冒泡鸭,均全面开放使用。

它们一个是聊天类应用,定位个人效率助手。

一个是 AI 开放世界平台,提供海量智能体,主打一个休闲娱乐。

具体效果怎么样?火速注册登录,量子位带大伙一睹为快。

先来看效率工具跃问。

第一轮基本问答我们让它对比一下 ChatGPT 和 Claude 的不同,重点:以图表形式呈现。

结果很快啊——

不止是开发公司、模型结构、檔案读取能力这种硬性对比,也有专注方向、创新水平、安全性等偏主观的总结,一共 14 个小项,主打一个全面:

第二轮看看联网、信息检索能力。

和很多大模型一样,跃问的知识库信息只截止到 2023 年,后面的信息自然只能现搜了。

" 今天的天气如何 " 太简单,我们直接问它马斯克腦机接口公司的进展如何。

结果,准确检索到 1 月份首位志愿者植入芯片的重大事件。

不过不知道是不是对 " 重大进展 " 这一词有不同理解,跃问没提几天前这位志愿者可以打游戏的报道。

我们追问之下,它倒也准确 " 交代 " 出来,包括志愿者名字、玩的什么游戏——除了游戏,下象棋 7 胜 4 负的事儿也一并提了。

第三轮:檔案处理。

身处 AI 科技圈,最新论文和大佬教程我们自然要紧跟步伐。

先用 OpenAI 前科学家 Karpathy 不久前的《从头构建 GPT Tokenizer》视频摸摸底。

直接给俩小时长的视频目前没有哪个大模型能直接解析,我们还是上传字幕檔案。

很快,全英文的内容跃问刷刷刷地就总结完毕:

仔细帮大家验证了,里面提到的例子都有都对。用起来相当给力。

对于论文来说就更简单了,直接给 arXiv 的链接就行。

一篇 8.3 万字(基本满足日常所需)的大模型微调方法论文(《AutoFT: Robust Fine-Tuning by Optimizing Hyperparameters on OOD Data》)丢进去,最核心的内容几秒便可知。

至于数据处理,如下图所示,图片转表格、净增长率计算,这种需要复杂逻辑推理的任务,跃问用代码的方式轻松解决。

最后,大家关心的多模态:

解读表情包,easy。

挑战一下投资机构整理的 AI 视频公司全景图。

别看 logo 们字体五花八门,跃问不仅迅速识别,还按照原图归门别类,阅读起来相当清晰。

相比之下,有同类选手不仅识别漏洞一个接一个,格式也完全顾不上。

总的来说,说起目前市面上的 AI 个人效率助手,已经不算少。但跃问,该有的功能不仅有,在多模态、长文本理解上也能做得更好。

并且最重要的是:免费!

使用起来没啥限制,目前也不用担心宕机、模型 " 太累了 " 回答不出问题(手动狗头),所以完全不失为一个优秀的平替。

至于冒泡鸭,它有 app 版也有 web 版。

平台上载有各种由多模态大模型驱动的智能对话体,可以进行各种有趣的对话、也可以探索有趣的剧情互动游戏(" 戏精 " 们有福了)。

实在不够,还可以自己上手创建:

官方也提供了非常详细的上手文档,包教包会。

我们浅试了《逃离精神病院》这一剧情。

和 AI 的对话相当流畅、沉浸,让人一不小心抬头看时间才发现已经玩了好久。

(不瞒您说,量子位开了好几轮都没能成功逃出 " 精神病院 ",难度还是有亿点点的。)

对于大模型产品,姜大昕表示:"我把模型和产品的关系比喻成灵魂和皮囊。大家一定听过一句话,好看的皮囊千篇一律,有趣的灵魂万里挑一。我们希望灵魂能更加有趣一点,才能显示出产品的不同。"

那么,跃问和冒泡鸭背后的 " 灵魂 " ——大模型们长什么样?

" 铁人四项 " 攀登万亿参数模型

冒泡鸭和跃问的背后,是阶跃星辰已经成熟的两款千亿参数大模型。

该公司将其称为 Step 系列通用大模型,分别是 Step-1 千亿参数语言大模型,以及 Step-1V 千亿参数多模态大模型。

一路看来,阶跃星辰训模型的路,走得出奇的顺。

去年 7 月起,研发团队正式开始训练模型。

2 个月后,综合性能超过 GPT-3.5 的千亿参数大模型 Step-1,一次性训练成功。

在大模型遍地开花的时代,听起来拥有一个模型并不是什么难事,但短时间内一次成功,这种效率仍然令人咋舌。

姜大昕把原因归结于两点。

一是团队本身在 AI 领網域有经验和积累;

二是创业公司团队精悍,能对训练中遇到的问题及时沟通与反应。

这次成功极大地鼓舞了团队的信心," 这验证了我们的方法是正确的。"

再 2 个月后,也就是去年 11 月,千亿参数的多模态大模型 Step-1V又告成。

Step-1V 大模型可以精准描述和理解影像中的文字、数据、图表等信息,并根据影像信息实现内容创作、逻辑推理、数据分析等多项任务。此外,它还能理解视频中的内容。

上海人工智能实验室推出的大型模型评估平台 " 司南 "(OpenCompass)多模态模型评测榜单显示,阶跃星辰研发的 Step-1V 位列第一,性能比肩 GPT-4V。

" 千亿参数的 GPT-3.5 模型是一个重要的分水岭。" 姜大昕表示。

模型要达到 GPT-4 的万亿参数规模,各个维度的要求都上了一个台阶。

譬如,训练万亿模型需要等效 A800 万卡单一集群,进行高效稳定的训练;需要十万亿 tokens 的高质量数据;需要驾驭好新颖的 MoE 架构。

姜大昕称,以上几点,无论是有哪一点有所不足,都会导致 Scaling Law 难以向上攀登。

但是!

就在前几天的全球开发者先锋大会开幕式上,阶跃星辰又给出了万亿参数 MoE 语言大模型 Step-2的预览版——这也是国内初创公司,首次交出的万亿参数模型答卷。

姜大昕介绍,Step-2 从去年 12 月启动训练,目前训练稳定,待完全训练完毕和打磨成熟。

" 我坚信 Scaling Law,(会)训练更大模型。" 姜大昕谈到,团队追求的是多模理解和生成的统一,"Step 系列大模型将为多模理解和生成的统一奠定坚实基础。"

基于实践经验,团队把攀登 Scaling Law 称为一个 " 铁人四项 " 般的超级工程。

哪四项?

算力、系统、数据、算法。

而阶跃星辰自然有自己熟稔的打怪套路。

算力方面,通过自建机房 + 租用算力,积极进行算力储备;

系统方面,团队核心成员实践过单集群万卡以上的系统建设与管理,训练千亿模型的 MFU(有效算力输出)达 57%;

数据方面,数据团队核心骨干出身必应搜索引擎,曾支持全球 100 多种语言,为 200 多个国家和地区提供服务,对全球互联网高质量语料的分布有深入了解,并建立起强大的数据处理和知识图谱流水线;

算法方面,团队不仅能驾驭各种架构,比如万亿参数的 MoE 架构,而且对大模型的认知以及发展路线有深刻洞察。

不想只在时代的风中凌乱

面对铁人四项和多模态融合之路,阶跃星辰就这么默默进发了一年。

那么,是什么样的团队行进在这条 Scaling Law 之路上?

量子位得知的消息是,阶跃星辰现在已经有一支 150 多人的队伍。

领队者姜大昕,现任阶跃星辰 CEO,同时也是团队算法负责人。

2005 年,姜大昕获纽约布法罗州纽约州立大学计算机科学博士,在机器学习、数据挖掘、自然语言处理、生物信息等领網域有丰富的经验和工程经验。

博士毕业后,他先后任南洋理工大学担任助理教授,MSRA(微软亚研院)研究员。

2011 年开始,姜大昕转入微软亚洲互联网工程院(STCA)工作。

该中心主要负责微软全球产品的研发工作,包括必应搜索引擎、智能语音助手 Cortana、Azure 认知服务以及 Microsoft 365 的自然语言理解系统等。

去年 3 月,姜大昕正式升任为微软副总裁,同时兼任亚洲軟體技术中心 WebXT S+D(网络体验、搜索和分销)集团总经理。

——是的,你没听错,刚刚被升职,明明可以在微软干到退休,却跑出来创业了。

" 在微软,只能基于 OpenAI 的模型做工作。" 姜大昕回忆,即便是微软和 OpenAI 的关系,使用其模型也只能调用 API,对黑盒里的秘密、模型算法的修复 / 迭代建议,完全插不上手。

我当时感觉整个世界在我身边呼啸而过,都在往前冲,我在原地很茫然,留下自己在风中凌乱,我不知道我在干什么。

琢磨再三,姜大昕决心不能再被动地风中凌乱。

于是,离开微软;于是,躬身入局。

有了创业想法的姜大昕,与现在阶跃星辰的数据负责人焦斌星" 密谋 " 两个多小时,一拍即合。

焦斌星同样出身微软,是中科大和 MSRA 联合培养博士。

博士毕业后,焦斌星正式入职微软,是微软必应引擎核心搜索团队前负责人,日常工作主要是利用数据挖掘和 NLP 算法优化索引和搜索质量;也曾开发全球高质量站点的自动挖掘算法并用于索引和排序。

还在微软时,他二人就听说过外界盛传大模型时代的 " 数据荒 ",即 Scaling Law 所需的数据不够用了。

当时,他们不以为然。有搜索引擎背景在,眼见互联网有上亿、上万亿的网页网站,怎么会不够用?

等到自己置身其中时,发现是真的不够用(笑死)。

好在现在既可以从多模态数据中挖掘更多数据,也可以像 OpenAI 训练 Sora 那样使用人造数据。

核心团队的另外一位成员,朱亦博,此前拥有多次单集群万卡以上的系统建设与管理实践经验。

他博士毕业于美国加州大学圣芭芭拉分校,曾任微软研究院研究员。

在这一波浪潮袭来之前,他的工作主要面向大规模系统以及超高速度性能网络。

2018 年,他任职字节跳动,负责公司 AI 基础设施与基础 AI 框架,开始积累万卡集群的搭建经验;2022 年底,他离开字节,跳槽至 Google 任高级主管,直接支持 OpenAI 最大劲敌、Claude 的背后公司 Anthropic。

可以说,阶跃星辰三位核心骨干的经历十分相似,就是第一阶段(博士期间)进行相关研究,第二阶段进入大厂在一线打拼,一直都在和 AI 的最新进展亲密贴贴。

当 ChatGPT 引领的大模型时代开始时,他们都意识到这是一个大变革,因此以最快速、最灵活、最全面的方式投身变革当中。

如果 AGI 是一个需要长期攀登的山峰,看到正确的路径,建立正确的能力,比早走几步更加重要。

One More Thing

最最最后,阶跃星辰的个人效率助手跃问,刚刚上线了一个很赞的新功能。

叫一图读懂。

说大白话就是丢给它一个文档,就能一键生成解析重点的长图文

这是此前的 ChatBot 没上线过的功能,想要体验的朋友们,速去哟~

—  完  —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們