大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星

2024-02-03 简体 HK SG TW

今天小编分享的科学经验:1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星,欢迎阅读。

一个体量仅为 2B 的大模型,能有什么用?

答案可能超出你的想象。

因为若是用四个字来概括,那就是" 多、快、好、省 ":

多:它是业界第一个在端侧部署多模态的大模型。

快:一张 1080Ti 可高效微调、一台机器可以持续训练。

好:性能跟体量极具反差感,在多项成绩中超越了一众主流 " 大体量 " 大模型。

省:1 元 =1700000 tokens,成本为 Mistral-Medium 百分之一

那么,这个能够" 以小博大 ",颇有四两拨千斤意味的大模型,到底什么来头?

不卖关子,它正是由清华系初创公司面壁智能最新发布的旗舰终端大模型——MiniCPM。

并且团队还给它起了个别具一格的昵称——小钢炮。

而在众多亮点之间,最令人意外的还是小钢炮用 2B 的 " 姿势 " 所表现出来的性能。

例如与同样是采用 " 以小博大 " 路数的大模型标杆之作 Mistral-7B 做比较,小钢炮多项标准测试成绩均胜出:

再把与小钢炮同 " 体量 " 的选手拉出来,大部分能力依旧是处于领先,并且英文能力还是较为出众的那种:

即使把 Mistral-7B 更大的模型拉进来同台比擂,例如 Llama2-13B、MPT-13B、Falcon 40B,多项成绩较为出众的仍是小钢炮:

若不论大模型的尺寸,把主流的全部囊括进来,在最接近人评的测试集 MT-Bench 中比较,小钢炮也取得了较为不错的成绩:

不仅如此,根据面壁智能 CEO李大海的介绍:

int4 量化版小钢炮,可以在闪存应用压缩 75% 的情况下,性能可以做到基本无损耗。

有一说一,成绩和榜单是大模型能力的一方面,但更重要的还是要看大模型在实际应用中的效果。

2B" 小钢炮 " 效果一览

老规矩,我们还是从不同维度来看下小钢炮的实际应用效果。

中英夹杂提问,精准翻译成法语

让大模型在两种语言之间做翻译已然是件常见的事情。

团队在现场给小钢炮的翻译任务加了一把难度,中英混合提问,并要求把整句翻译成法语:

Translate this sentence into French: "I am a fresh man on Chinese, do you know how this sentence is translated: 如何用 Python 创建一个简单的网页爬虫?"

从翻译结果来看,小钢炮准确地理解了中英混合的表述,并按照要求给出了精准的法语翻译。

如果让人类给一句话添加 emoji,那么过程大致是要先理解这句话,然后再在恰当的位置塞进 emoji 表情。

那么这个任务小钢炮是否能 hold 住呢?

请看结果:

生日是要的,和也精准塞进了恰当位置,最重要是小钢炮理解到了这句话是表达爱意。

再如 " 山东省最高的山是那座山,它比黄山高还是矮?差距多少?" 这样的问题,小钢炮也是轻松应对:

小钢炮给自己写代码

大模型对给定的任务写代码现在也是司空见惯了。

如果让大模型给自己写段代码呢?请听题:

编写一个 Python 程式来实现一个 MiniCPM 模型(Transformer 结构,40 层,每层维度为 2304,词表大小为 122753)。

小钢炮在接收到任务之后,随即开始 " 自己给自己写代码 ",并且每一步的步骤内容也是非常清晰:导入所需库→定义模型结构→定义训练和评估函数→训练模型→评估模型性能。

多模态首次上手机

正如我们刚才提到的,小钢炮的亮点之一就是它是业界第一个在端侧部署多模态的大模型。

在现场,李大海也对此做了相应的展示。

例如先 " 喂 " 给手机里的小钢炮一张图,并提问 " 这个蘑菇的名字是什么?有毒么 ",小钢炮就会先看图再作答:

这根蘑菇的名称是 " 蝇鹅膏 "。它有毒,可以引起恶心、呕吐和腹泻等症状。

当然,连续追问、上下文对话也是不在话下:

据了解,上面展示的这些能力都是在量化版小钢炮 +OPPO 手机 + 骁龙 855 芯片这个配置之下完成的。

之所以如此,是因为团队想要展示小钢炮是一个" 省钱的大模型 "。

怎么理解?

刚才手机里 GPU 的成本大约 600 元,每秒 7.5tokens,假设运行 5 年报废,共计 170 万 tokens,则其推理成本仅为 1 元。

如此,便可以得到一个成本公式:

1 元 =1700000tokens。

相比 GPT-4 的推理成本,1 元 =4700tokens,可以说是指数级的把价格打下去。

即便是与 Mistral-medium 相比,成本也是其 1/100。

这次也同步开源了一个更大也更好展示多模态能力的OmniLMM-12B,玩法就变得更多了。

例如举着手机,在摄像头下方比划石头、剪刀、布,并向小钢炮提问:

我现在玩的可能是什么游戏?

小钢炮看完之后,在理解基础上便会开始作答:

你可能在玩的游戏是石头剪刀布。

然后继续给小钢炮看一眼 " 拳头 ",并发问:

手势在游戏中是什么意思?

继续给小钢炮看一眼 " 拳头 ",并发问:

如何在游戏中赢我?

小钢炮思考片刻后,给出了正确答案:

要在游戏中获胜,另一玩家需要出布。

值得一提的是,从上面的演示中,我们可以看到小钢炮在处理过程中是有一段时间的延迟。

现场也有人调侃说 " 我看这个视频演示没有加美颜 "(指加速处理)。

对此,面壁智能联合创始人、清华大学副教授刘知远回答说:

没错,我们不加 " 美颜 ",比较朴实。

而且小钢炮在多模态这块还是提高的空间的。

怎么做到的?

整体来看,面壁智能在技术路线上一直高举 " 高效 " 大旗,主要是从 AI 的三大要素作为突破口,即算力、算法和数据。

在算力层面上,面壁智能认为 "Infra 是大模型创业护城河 ",Infra 可以决定一家创业公司的技术上限。

若是没有一个足够 " 能打 " 的 Infra,即使短期内能够打造较好的模型,但越往后、越深入时会发现很快就会遇到技术瓶颈。

因此,在早年前,团队便在业内较早地提出了 BMTrain,一个分布式的高效训练框架。

有了它,很深入地优化工作就可以快速地结合 Infra 落地实现。

除此之外,团队陆续还推出了高效推理框架 BMInf、高效压缩框架 BMCook,以及高效微调框架 BMTune 等等。

有这些具体的工具,便形成了面壁智能在算力层面的杀手锏——面壁 ModelForce,全流程优化加速套件平台。

在算法层面上,面壁智能在技术发展过程中所积累出来的利器则是面壁模型沙盒(Model Sandbox)。

这实则也是一种方法论,可以将大模型从过去的炼丹形式变成了一种实验科学。

而在历经上千次的模型沙盒实验之后,团队在算法中的各种细节上也得到了一系列业界最优配置。

例如最优批次大小(batch size),可以大幅节省大模型训练时的 token 量;再如所有尺寸的模型可以通过最优的超参数的配制,保证训练任意大小的模型取得最好的效果等等。

最后在数据层面上,优秀的数据也决定了大模型最后性能的成败。

而这次小钢炮的诞生,面壁智能仅仅是用了所积累的优质数据中,通过方法论所精选出来的 1T。

值得一提的是,为了行业更好的交流和发展,面壁智能开源了训练、退火两个阶段来的数据配方来供参考。

除此之外,与小钢炮相关的更多技术细节以及如何在手机上部署的教程等,均已经在 GitHub 中开源。

感兴趣的小伙伴,可以在文末链接处了解更多详情 ~

不过最后,还有一个问题值得讨论来一波:

大模型,为什么往 " 小 " 了搞?

其实在 2023 年,在大模型以小博大方面,便已经开始有了苗头。

最为典型的,就是小钢炮此次对标的 Mistral-7B。

在它刚刚出道之际,便以更小的 " 姿势 " 击败了更大体量的 Llama2-13B、Llama 1(34B)等一众大模型。

这就为 " 比大更大 " 内卷下的模型圈带来了一定启发。

不过在此背后,大模型往 " 小 " 了做,所体现的是一种更大的趋势。

一方面,从大模型从 2022 年底爆火至今,一个非常明显的变化就是从专注训练,逐渐转向推理。

这是一个技术发展必然的结果,要从比性能和结果,到比谁的大模型更好用;而这个 " 用 ",最好、最直接的体现就应当是在端侧谁可以更 " 多快好省 " 地运行。

对此,李大海表示:

站在大模型时代之下,我们都在提的一个概念便是 "AI 原生应用 ";这个时代需要的全新作業系統,就是 AI 原生应用 +AI 原生硬體。

而其中的 AI 原生硬體,其实很简单,就是只要能在端侧运行大模型的硬體就是原生硬體。

因此,端侧的大模型就显得格外重要。

另一方面,市场的表现也是印证大模型往 " 小 " 发展的一点。

自从去年 7 月开始,非常明显的一点是,众多主流手机厂商、PC、汽车品牌,陆续在宣布接入大模型。

手机厂商例如华为、小米、荣耀、OPPO、Vivo、三星等;车企包括小鹏、蔚来、理想、吉利等等。

需求之大,可见一斑。

值得一提的是,从小钢炮在 GitHub 开源的内容来看,目前它已经在众多品牌的老机型上做了部署实验。

因此,老手机上跑大模型也成为了一种可能。

不过细心的朋友也注意到了,面壁智能其实从成立至今,也仅有短短一年的时间。

这就不禁让人发问:一年时间是如何在技术上做到的这般突破?

其实在此背后,更多的是清华系成员们在公司成立之前,长久以来在技术上的积累与跟进。

早在 2018 年,面壁智能的核心技术团队在 BERT 发布之后,便聚焦在清华 NLP 实验的相关工作,发布过全球首个知识指导的预训练模型 ERNIE。

随后在 2020 年,他们也作为 " 悟道 " 大模型首发主力阵容发布了全球第一个 20 亿级中文开源大模型 CPM 1,也持续参与了之后的 CPM 2 和 CPM 3。

除此之外,在 2022 年,在开源相关工作中,面壁智能核心成员也参与到了 OpenBMB 开源社区的成立与运作。

由此可见,面壁智能的核心技术成员是属于中国最早进行大模型研究的那一批。

正是基于这样的技术积累,也就不难理解面壁智能为何能够在短短一年时间内交出如此之多的 " 作业 " 了:

据了解,截至目前,面壁智能拥有 100 多人的科研团队。

虽然平均年龄仅为 28 岁,但清北含量高达 80%,也有来自阿里、字节、百度等国内外知名大厂的工程团队。

加上团队还主打一个 " 双 CP" 组合,即大将里的 " 小哥哥 "+" 小鲜肉 " 里的大将,这种经验与创新的碰撞,或许也是推动发展进程的原动力之一。

诚然,开年小钢炮的发布给大模型带来了不少惊艳,但也正如团队所说,相关工作还有许多需要改进之处。

因此面壁智能在接下来的新进展,是值得关注的。

One More Thing

在小钢炮发布现场,一张五道口大模型 Valley图格外吸睛。

用李大海的话来说:

这是全中国大模型最密集的地区。

嗯,五道口,不愧是 " 宇宙中心 "。

开源地址(内含技术报告):

MiniCPM GitHub:

https://github.com/OpenBMB/MiniCPM

OmniLMM GitHub:

https://github.com/OpenBMB/OmniLMM

—  完  —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們