今天小编分享的科学经验:开源大模型重击OpenAI!小扎放出LLaMA2炸裂科技圈,联手微软高通冲击市场格局,欢迎阅读。
一纸公告," 大模型市场格局变了 "。
Meta 与微软联手发布免费、可直接商用的 LLaMA2。而作为首选合作伙伴,微软 Windows 可本地运行这一版本。
此外在 AWS、Hugging Face 上也可以获取,高通也官宣成为其合作伙伴。
这种背刺 OpenAI 的操作,让不少网友直呼刺激。
还有人对这种开放程度表示惊叹,毕竟上个开源版本就已被产学研界广泛使用——LLaMA 访问需求已超 10 万次,已经有小伙伴开发应用程式供大家免费测试了。
但与此同时,质疑声随之而来:
核心作者已离开 Meta,论文正文查无此人;
如此注重安全,以至于最终可能毫无用处;
虽说可商用,实际上有附加限制。
……
有人调侃小扎 be Like:
核心作者已离开
此次 LLaMA2 的发布,从作者列表开始就已经透露不少玄机。
首先,规模更大,团队集成到了GenAI部门。这是小扎专门应时而设的生成式 AI 产品部门。
第二,昔日一些核心作者已经不见踪影。比如 Armand Joulin, Edouard Grave, Guillaume Lample,Timothee Lacroix 等。
其中一位在网上吐槽:
因为核心作者离开公司就将其从论文中删除,这是我很庆幸离开 Meta 的原因之一。
事实上,在论文的附录上,还能看到他们的名字。不过正文部分已经查无此人。
据小扎和 GPT-4 介绍,此次 LLaMA2 共发布了从 70 亿、130 亿、340 亿以及 700 亿参数的预训练和微调模型,将免费提供用于研究和商业用途。
预训练过程,相较于上一代数据增长 40%,上下文长度也增加了一倍,并采用分组查询注意力机制(GQA)来提升性能。
微调阶段,其版本称为 Llama 2-Chat,共收集了超 100 万条人工标注用于 SFT(监督微调)和 RLHF。
值得一提的是,此次还曝光了每个预训练模型 GPU 所需总时长。
热心的网友测算了下总成本,如果以 1.5 美元 /A100 计算,那么700 亿参数模型成本将为 260 万美元。
感兴趣的朋友可进一步前往论文查看哦 ~(文末附上链接)
微软成 LLaMA2 首选伙伴
不过除了 LLaMA2 本身值得关注之外,其开放合作机制也引发了不少的热议。
公告中虽然强调" 免费用于研究和商业用途 ",但仍有不少限制。
因此有人直言:我不明白 LLaMA2 这次炒作!
比如,可商用協定实际暗含附加限制。
有网友发现在 GitHub 许可证檔案上发现,如果使用者利用 LLaMA2 提供产品或服务,月活跃用户超过 7 亿,那么必须向 Meta 申请许可。
而 Meta 可自行决定向其授予许可。
还有就是可接受使用政策限制很多。这样一来,就可能导致 " 回答得很无聊,最终可能导致毫无用处 "。
在政策中可以看到,主要分为四个部分:违反法律或侵犯他人权利;参与、促进、煽动、促进或协助规划或开展对个人造成死亡或身体伤害风险的活动;故意欺骗或误导他人;未能适当向最终用户披露人工智能系统的任何已知危险。
因此有人认为相较 ChatGPT 而言,LLaMA2 少了些灵活性。这可能就是开源与闭源之间的区别。
但不可否认的是,Meta 坚定选择开放开源这条路径。
甚至于此次,还邀请了产学研界的伙伴高调地发表了一篇支持声明。
包括英伟达、AMD、HuggingFace、YC、GitHub、 Databricks、Shopify、Zoom 等公司的企业高管,还有 UC 伯克利、MIT 等教授,比如 CMU 教授、MBZUAI 大学校长邢波。
以及更多伙伴也顺势官宣与 Meta 合作,把 LLaMA2 集成到自己的产品中去,比如高通。
对此此番 LLaMA2 炸场,你怎么看?
而开源与闭源,在大模型时代,究竟谁才是更优解?
论文链接:
https://scontent-sjc3-1.xx.fbcdn.net/v/t39.2365-6/10000000_663429262362723_1696968207443577320_n.pdf?_nc_cat=101&ccb=1-7&_nc_sid=3c67a6&_nc_ohc=5ol-jUSglG4AX_QM_ym&_nc_ht=scontent-sjc3-1.xx&oh=00_AfAjtvFkEIu8MPpfQykAZosxwZrew4g_n0D_DKkTOuyIVA&oe=64BBB691
参考链接:
[ 1 ] https://about.fb.com/news/2023/07/llama-2-statement-of-support/
[ 2 ] https://about.fb.com/news/2023/07/llama-2/
[ 3 ] https://twitter.com/ylecun/status/1681336284453781505
[ 4 ] https://github.com/facebookresearch/llama/blob/main/LICENSE
[ 5 ] https://arxiv.org/abs/2302.13971
[ 6 ] https://twitter.com/moinnadeem/status/1681393075367841792
[ 7 ] https://twitter.com/GuillaumeLample/status/1681346701766934543?s=20
[ 8 ] https://chat.openai.com/share/c9868736-934f-40ce-a470-c0bb4359c260
[ 9 ] https://www.facebook.com/zuck/posts/pfbid02j7TCKZHRe1X4K3DA7EdA96q6Cx7DS3ZixKyrqsyx7NvUwx9X88V18nnqLF3BAsXjl