大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

小扎回应Llama 4对比DeepSeek:开源榜单有缺陷,等17B深度思考模型出来再比

2025-05-01 简体 HK SG TW

今天小编分享的科学经验:小扎回应Llama 4对比DeepSeek:开源榜单有缺陷,等17B深度思考模型出来再比,欢迎阅读。

Meta 首届 LlamaCon 开发者大会开幕,扎克伯格在期间接受采访,回应大模型相关的一切。

包括 Llama4 在大模型竞技场表现不佳的问题:

开源基准测试存在缺陷,常偏向特定不常见用例,与产品实际使用场景脱节,不能真实反映模型的优劣。

试图为这类东西进行过多优化会误入歧途。

对于我们团队来说,搞一个冲到榜单顶部的 Llama 4 Maverick 版本相对容易,但是我们发布的版本根本没有对此进行调优,排名靠后是正常的。

以及与 DeepSeek 的比较:

我们的推理模型还没有出来,所以还没有和 R1 相应的模型去对比。

与此同时,在 Meta 合作伙伴亚马逊的网站代码中,被扒出要即将推出的 Llama4 推理模型为 17B 参数的 llama4-reasoning-17b-instruct。

活动期间,有那么点 Meta 不语,只是一味地抛出 Llama 系列 " 亮点 " 的意思了(doge):

除即将推出超 2 万亿参数的 Llama 4 Behemoth 模型之外,代号 "Little Llama" 的 80 亿参数小模型可能会在未来几个月推出。

推出官方 Llama API 平台

推出一系列 AI 安全工具,包括检测和防止提示注入、越狱等风险。

扎克伯格谈 " 智能爆炸 "

扎克伯格认为随着軟體工程和 AI 研究的自动化推进,智能爆炸具备实现的可能性。从技术发展趋势来看,AI 写代码能力不断提升,预计未来 12-18 个月,大部分相关代码将由 AI 完成。

这不仅意味着开发效率的大幅提高,还可能带来代码质量的提升,因为 AI 能够基于大量的数据和先进的算法,生成更优化、更高效的代码。

然而真正达到智能爆炸还面临着诸多现实层面的制约。在物理基础设施上,构建大规模计算集群复杂且耗时,从研发到稳定应用需要一定时间,同时还需要配套建设网络设施,确保数据的高速传输;建设专门的数据中心场地,要经过严格的审批流程;解决能源供应问题,无论是采用传统的燃气轮机发电还是绿色能源,都涉及到复杂的供应链体系,这些环节都需要耗费大量的时间和资源。

在人机协同方面,人们对 AI 系统的适应和反馈同样需要时间。AI 系统并非一经推出就能被用户熟练使用,而是需要一个相互学习的过程。用户在使用过程中逐渐掌握与 AI 互動的方式,AI 则通过分析用户的行为和反馈,不断优化自身的功能和性能。

在 Meta 广告团队的自动化排序实验中,尽管有大量的测试想法,但由于计算资源的限制,无法对所有假设进行充分测试;同时,为了保证测试结果的准确性和可靠性,需要大量的测试人力,这也在一定程度上限制了实验的推进速度。

扎克伯格认为,人们已经开始与 AI 建立起多种类型的关系,如将 AI 作为治疗师倾诉或朋友分享生活等,产品开发者应该尊重用户的选择。

虽然现阶段这类 AI 人际关系相关的产品在技术实现上还不够成熟,比如虚拟治疗师或朋友的形象往往只是简单的图片或粗糙的动画,缺乏真实的互動感,但随着技术的不断进步,为提升虚拟形象的真实感和互動性带来了新的可能。

换句话说,AI 和元宇宙战略在未来还有联动效应。

在产品设计理念上,避免过度干扰用户是关键原则。Meta 的 Orion 眼镜设计目标不仅仅是集成各种先进的技术功能,更重要的是要成为一副好用的日常眼镜。在不使用 AI 功能时,它要能像普通眼镜一样满足用户的基本需求,如佩戴舒适、外观美观;当用户需要使用 AI 功能时,又能便捷地提供服务,如语音互動、信息展示等。

这种设计理念同样适用于增强现实未来的产品设计,即让物理世界和数字世界自然融合,在为用户提供丰富数字内容的同时,避免数字元素过度充斥用户的视野,造成视觉和心理上的负担。

最后,扎克伯格回答了 " 如果軟體生产力在两年内提高 100 倍 " 会怎么样。

他认为从历史看,过去全人类大部分精力都用于养活自己,也就是从事农业为主。最近 100 多年来满足基本身体需求在人类精力中的占比越来越小。

这种转变有两个影响:一个是越来越多的人在追求创意和文化。第二是人们花在工作上的时间更少,而花在娱乐和文化上的时间更多。

但随着时间的推移,如果每个人都拥有这些超人类工具来创造大量不同的东西,就会出现令人难以置信的多样性。其中一部抽成果将用于解决难题:攻克疾病、推动科学进步、开发让我们生活更美好的新技术。

Llama 首次推出官方 API

此前 Meta 只管开源模型,部署托管各凭本事,现在终于推出官方 API 平台。

提供微调和评估 Llama 模型性能的工具。

新型芯片供应商 Cerebras 和 Groq 合作,提供高推理速度的选项。

承诺不会使用客户数据来训练自己的模型。

目前属于邀请测试阶段,需要排队。

不过手快的开发者在会场上就把 Demo 做出来了。

利用多模态能力,描述相机拍到的画面,整体上描述准确,不过其实这根香蕉是玩具,对 AI 来说还是难了。

Llama API:

https://www.llama.com/products/llama-api/#llama-protections

Demo 试玩:

https://llama-api-launch.craigsdemos.workers.dev

参考链接:

[ 1 ] https://www.dwarkesh.com/p/mark-zuckerberg-2

[ 2 ] https://x.com/craigsdennis/status/1917365062165225544

[ 3 ] https://x.com/btibor91/status/1917232574344384522

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  完  —

点亮星标

科技前沿进展每日见

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們