大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

最强开源大模型再度易主,这家初创公司是如何做到的?

2024-03-30 简体 HK SG TW

今天小编分享的互联网经验:最强开源大模型再度易主,这家初创公司是如何做到的?,欢迎阅读。

文 |   

在 Claude 3 Opus 将 GPT-4 挑落马下的同时,又是一款「最强开源大模型」来了。

当地时间 3 月 27 日,美国初创公司 Databricks 突然公布了旗下开源大语言模型 DBRX,号称是全球迄今为止最强的开源大模型,参数规模达到 1320 亿,表现更是超越 Meta 的 Llama2、「欧洲新秀」Mistral AI 的 Mixtral,以及马斯克旗下 xAI 公司刚刚开源的 Grok-1。

更重要的是,他们只花了 2 个月和 1000 万美元,在性能全面超越 GPT-3.5 的同时,训练时间和成本都只有 GPT-3.5 的一小部分。

不过公允来说,这当然不是一种合理的比较。一方面是 GPT-3.5 发布时的技术和算力成本,都很难和今时今日相提并论;另一方面是,DBRX 采用了与很多大模型不同的:

Mixture of Experts 专家混合架构。

「刷新」开源大模型性能,DBRX 验证了大模型训练的另一条路

Databricks 说 DBRX 大模型是全球最强,并非空穴来风。

首先,DBRX 在语言理解、编程和数学等核心能力的基准测试上,很轻松就击败了 Llama2-7B、Mixtral 以及 Grok-1。包括在开源基准测试 Gauntlet 的 30 多个测试中,DBRX 也优于所有对比模型。

图 /   Databricks

另外,不只是开源大模型,DBRX 在大部分基准测试中的表现也超越了 GPT-3.5,甚至在多个测试中非常接近公认第一梯队的 GPT-4。

最后也是关键的,尽管 DBRX 拥有 1320 亿参数,Llama 2 的参数规模是 700 亿,Mixtral 是 450 亿,Grok 则达到了 3140 亿,但在实际运行中,DBRX 平均只激活约 360 亿参数来进行推理。

这也让 DBRX 拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。

而做到这一切的基础,在于前文提到的专家混合框架。

众所周知,算力、数据和算法是人工智能的三要素。在算法上,谷歌团队于 2017 年发布的 Transform 架构至今依然是所有大模型的底层架构。DBRX 则在 Transform 架构的基础,采用了一种最早于 2022 年年底提出的专家混合架构,事实上包括前面提到的 Mistral AI 也在去年推出了基于该架构的 Mixtral 8x7B。

提出专家混合架构的论文,图 / arXiv

在该架构下,根据具体询问的内容和问题,模型只会激活不同的「专家」子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。换言之,DBRX 的参数规模将近 Llama-70B 的两倍,性能更强也更聪明,同时实际的推理速度和成本也都来得更好:

让大模型的性能和速度变得「鱼和熊掌,可以兼得」。

再加之训练的最后阶段,Databricks 的开发团队还将重点转向数据,采用「课程学习」的方式提高了 DBRX 的性能。

最终,「我们将开源大模型推向了新的技术水平,」Databricks 首席神经网络架构师兼 DBRX 构建团队负责人 Jonathan Frankle 说。

值得一提的是,Jonathan Frankle 在接受《连线》杂志采访时还透露,尽管他们相信专家混合框架的潜力,但在 DBRX 真正训练出来并完成基准测试之前,其实也不敢笃定最后的效果,甚至根本没想到 DBRX 还有在代码生成上的优势。

但不论如何,DBRX 都可能改变大模型的迭代和应用方式,更可以确定的是,开源大模型之争,还在继续加剧。

开源大模型:从 Meta 独占鳌头,到百家争鸣

前段时间,央视报道指出国产大模型之路面临的三大挑战,其中之一就是大多数国产模型基于 Meta 的 Llama 大模型,缺乏自主性。

其实不仅在国内,去年 7 月 Llama2 宣布「免费可商用」推出后,一举成为了全球开发者首选的开源大模型。毕竟只要经过简单的微调就能直接应用,何乐而不为。

不过 AI 行业的变化来得又快又凶猛:

先是 Mistral AI 发布 Mistral-7B,宣告全面超越更大参数规模的 Llama2-13B;

不久后,阿里宣布开源 720 亿参数的大语言模型通义千问 Qwen-72B,性能超越标杆 Llama2-70B,号称最强中文开源模型;

稍晚,谷歌也通过发布 Gemma 开始进入开源大模型的竞争,凭借 70 亿参数碾压 Llama2-13B(130 亿参数)。

现在我们又看到了,Databricks 也带着最新发布的 DBRX 加入了这场开源大模型之争。

打造 DBRX 的团队,图 /   Databricks

其实如果从业务层面,这几家开源大模型并没有太大的矛盾,比如 Databricks 作为一家面向企业的初创公司,打造 DBRX 的根本目的还是为企业客户定制大模型。按照官方的说法,从发布之日开始,企业客户就能在 Databricks 平台上利用 RAG 系统中的长上下文功能,用自己的私有数据构建一个自定义的 DBRX 模型。

但开源大模型之争的根源在于:不管开发者还是用户,都更倾向于最好的开源项目,群聚效应可能远比闭源大模型来得明显。

换句话说,最好的开源大模型往往会吸引闭源大模型之外的绝大部分厂商、开发者和用户,并基于此推动大模型的快速迭代和生态扩张。如果类比起来,就像是智能手机早期,Android 在一众移动作業系統(iOS 除外)中脱颖而出,并一举成为苹果之外厂商、开发者和用户的共同选择,随后走上了体验改进和生态扩张的快车道。

战争还在继续

显而易见,大模型的战争还在继续,就算是 OpenAI 也不敢一刻放松技术上的领先优势。君不见在最新的 Chatbot Arena 聊天机器人排行榜中,Claude 3 Opus 在经过时间洗礼和群众检验后已经超越了 GPT-4。

Chatbot Arena 对战图,图 / Hugging Face

开源大模型的战争当然也在继续,不管是谷歌、Meta、阿里,还是 Mistral AI、Databricks 以及更多的开源大模型厂商,都还在继续进行迭代,提高性能、提高效率。毕竟谁也无法笃定在这场快速变化的技术革命中,能不能守住甚至扩大优势。

Meta Llama2 虽然今天被连续吊打,但别忘了,扎克伯格已经预告了正在训练的 Llama3。按照雷科技之前的推算,我们可能在 7 月就能看到一场「复仇战」,届时 DBRX 能不能守擂成功:

我很好奇。

熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們