今天小编分享的互联网经验:Meta联手微软挑战大模型格局,最新Llama 2免费开源,可直接商用,欢迎阅读。
(图片来源:Meta 官网)
一夜之间,人工智能(AI)大模型格局再次发生巨变。
钛媒体 App 获悉,北京时间 7 月 19 日凌晨,市值近 8000 亿美元的科技巨头 Meta(原 Facebook,NASDAQ: META)发布最新 AI 大语言模型 Llama 2 系列,包含 70 亿、130 亿和 700 亿三种参数版本,模型信息和起始代码全部开源,并支持免费可商用,还包含针对会话聊天场景微调的 Llama 2-CHAT 模型版本。
相较于今年 2 月发布的 Llama 1,最新 Llama 2 训练所用的 token 翻了一倍至 2 万亿。Meta 表示,在包括推理、编码、精通性和知识测试等多个外部基准评分测评中,Llama 2 表现优于所有开源的 Chat 模型。
同时,Meta 今晨还宣布与微软、高通公司展开合作,Llama 2 将部署在微软云服务 Azure 上,同时 Llama 2 将能在高通芯片上运行,打破市场上英伟达、AMD 处理器对 AI 算力市场的垄断。
" 微软是我们 Llama 2 的首选合作伙伴,并扩大我们在生成式人工智能(AIGC)方面的努力。"Meta 认为,开放的方法对于当今 AI 模型开发是正确的,特别是那些在技术快速发展的大模型。公司还在论文中称,根据 Meta 对有用性和安全性的人工评估,Llama 2 可能是封闭模型的合适替代产品。
微软 CEO 纳德拉(Satya Nadella)和 Meta CEO 扎克伯格(来源:扎克伯格 ins)
2018 年图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)则发布推文直言," 这将会改变大型语言模型(LLM)市场的格局。"
Meta 挑战 OpenAI:Chat 性能更强、更安全,整体接近 GPT-3.5
十多年来,Meta 不仅玩 " 元宇宙 ",而且一直有一个 AI 技术研究的布局,尤其它的 instagram、Facebook 等社交产品急需算法带来广告支持。
今年 2 月,Meta 发布了 AI 大模型 Llama 1。公司称,研究人员对 Llama 1 的巨大需求震惊了,有超过 10 万条访问请求,而且更多开发者通过在 Llama 上面构建模型应用,并取得的惊人成就。不过,Llama 因为开源協定问题,一直不可免费商用。
时隔五个月后,当地时间 7 月 18 日,Meta 发布开源大模型 Llama 2,不仅可免费商用,而且公布了一份论文式技术报告,全面展示了 Llama 2 的技术能力和评测信息。
(注:论文地址:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/ ;项目地址:https://github.com/facebookresearch/llama)
据悉,Llama 2 是 Llama 1 的更新版本。相比于 Llama 1,Llama 2 的预训练模型是在 2 万亿 token(文本数据部門)上训练的,比 Llama 1 数据大小多了 40%(增加 1.4 倍),上下文长度也翻倍,并采用了分组查询注意力(GQA)机制,而精调 Chat 模型是在 100 万人类标记数据上训练的。
在技术上,新的 Llama 2 使用了优化的自回归 Transformer 框架,当然也支持 PyTorch,执行了更稳健的数据清理,更新了混合数据。
目前,Llama 2 的系列模型有 7B、13B 和 70B 三种。而且 Meta AI 表示他们还在训练 34B 的版本,但暂时不会对外发布。而 Meta 的精调版大模型LLAMA 2-chat,是基于 LLAMA 2 针对对话场景微调的版本,同样支持 7B、13B 和 70B 参数三个版本,使用 RLHF、监督微调 ( SFT ) 等技术对模型进行迭代优化。
根据 Meta 展示的多个评测信息,截至目前,Llama 2 70B 的性能表现更加接近 GPT-3.5,与谷歌 PaLM ( 540B ) 持平或表现更好,但 Meta 也承认 Llama 2 距离 GPT-4 和谷歌 PaLM-2-L 等领先非开源模型的性能仍存在较大差距。
Alpaca 研究团队的斯坦福基础模型研究中心主任 Percy Liang 表示," 但对于很多场景,你并不需要 GPT-4。"
此外,论文还提及了 Llama 2 在安全性上的努力。其中 Meta 在安全微调中使用了监督安全微调、安全 RLHF、安全上下文蒸馏等技术,而且使用三个常用基准评估了 Llama 2 的安全性,整体良好,比其他大型语言模型更加稳定、更佳安全。
微软 " 脚踩两只船 ":不仅联姻 Meta,而且对 GPT 版 office 涨价
引领这一轮 AI 浪潮的微软,在今天全球合作伙伴大会(Inspire 2023)上终于亮出新战略。
当地时间 7 月 18 日,Meta 和微软联合宣布,自今天开始,Meta 公司的 Llama 2 将在微软的 Azure 和 Windows 平台上线。
微软 CEO 纳德拉表示,Llama 2 可以让 Microsoft Azure 的开发人员能够使用它进行构建,并利用他们的云原生工具进行内容过滤和安全功能。它还经过优化,可以在 Windows 上本地运行,为开发人员提供无缝的工作流程。
Meta 公司表示,Llama 2 将在微软的 Azure 云上线,后续将在亚马逊 AWS 和 Hugging Face 等其他平台上分发,向全球开发者首发基于 Llama 2 模型的云服务。
微软 CEO 纳德拉(Satya Nadella)
所以,目前在微软的开发平台上拥有两个大模型选项:不仅拥有 OpenAI 的 GPT 系列大模型,而且还有 Meta 的 Llama 2 大模型。
同时,微软周二还宣布,面向 Office 365 E3、E5、商业标准版和商业进阶版的订阅商户,微软 Microsoft 365 Copilot 将统一定价为每个用户每月 30 美元。根据官网定价,这些面向企业用户的订阅服务,收费标准从每个用户 12.5 美元至 38 美元 / 月不等,这意味着微软把商业用户 Office 服务的定价提升了 1-3 倍。
微软企业副总裁兼消费领網域首席营销官 Yusuf Mehdi 表示,在过去几个月里,全球已经有 600 家公司已经参与了该产品的抢先体验计划,其中就有毕马威、阿联酋国家发展银行等知名机构。他强调,使用 Copilot 的客户越多,他们对 Copilot 的热情就越高。很快,没人会愿意在没有它的情况下工作了。
这足以显现微软与 OpenAI 实现 Office AI 产品,对于市场的定价权和吸引力。
微软曾透露,截至 2023 年第一季度,全球总共有 3.82 亿人正在使用商业版本的 Microsoft(Office)365 軟體。
不过,微软今天并没有公布该产品正式上线的日期。除微软,谷歌也曾在今年早些时候宣布将把 AI 功能集成到云办公套件 Google Workspace 里。包括 Zoom 等细分行业的互联网軟體服务商也在抓紧上架 AI 功能。
值得注意的是,芯片巨头高通今晨联合宣布,计划从 2024 年起,在旗舰智能手机和 PC 上支持基于 Meta Llama 2 的 AI 部署,赋能开发者使用骁龙平台的 AI 能力,推出全新生成式 AI 应用。
微软股价日线图(来源:TradingView)
受新消息影响,截至美股周二,微软股价收涨 3.98%,创出历史新高。2023 年至今,微软累计涨幅达 50.05%。
(本文首发钛媒体 App,作者|林志佳)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App