本周（4.15-4.21）AI界发生了什么？

今天小编分享的互联网经验：本周（4.15-4.21）AI界发生了什么？，欢迎阅读。

文｜赵炜嘉

编辑｜邓咏仪

大佬言论

李彦宏：开源模型将会越来越落后

4 月 16 日，百度创始人、董事长兼首席执行官李彦宏在 Create 2024 百度 AI 开发者大会上表示，未来，自然语言将成为新的通用编程语言，每个人都可以成为一名开发者，用自己的创造力改变世界。李彦宏还指出，" 大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以，开源模型会越来越落后。"

扎克伯格：80 亿的 Llama 3 还不够小，大模型需要提升训练质量

4 月 18 日，Llama 3 正式发布后，扎克伯格在知名主持人 Dwarkesh Patel 的播客中，谈及 Meta AI 的技术路线、未来规划和开源哲学。扎克伯格表示：Llama 3 最小版本的 80 亿参数模型 " 还不够小 "，无法满足大量使用场景。他更倾向于将模型蒸馏到 5 亿、10 亿级别，看看能用来做什么。

李飞飞报告：中国大模型世界第二，但专利数、机器人全球第一

4 月 15 日，由华裔女科学家、" 人工智能教母 " 李飞飞联合领导的 HAI 研究所（Stanford HAI）近日发布了《2024 年人工智能指数报告》。

报告中指出，2023 年，61 个著名的人工智能模型源自美国的机构，超过欧盟的 21 个和中国的 15 个。然而，中国依然是美国最大的竞争对手，中国的机器人安装量居世界首位；同样，世界上大多数人工智能专利（61%）都来自中国。

△图源：HAI

另外，4 月 18 日，李飞飞在拜登的国情咨文演讲中呼吁，希望拜登政府出资建设一个国家计算能力和数据集仓库。她指出，当前 AI 学术界明星人才正大量流失，大公司正在以高薪挖掘学术界人才资源。而研究大模型的高昂成本正在将研究人员排除在该领網域之外，从而损害了学术界的独立研究。

大事件

Meta 开源新一代模型 Llama 3

当地时间 4 月 18 日，Meta 公司宣布最新开源推出新一代大型语言模型 Llama 3，包含 8B 和 70B 两种参数规模。Llama 3 在由 24000 块 GPU 组成的定制集群上，使用 15 万亿个 token 训练的，上下文长度实现 8K，推理编码大幅提升，代码和权重全开源。Llama 3 现可在网页版 Meta AI 免登录使用。

Stable Diffusion 3 API 发布

4 月 17 日，Stability AI 正式发布 Stable Diffusion 3 API，新的 SD3 在文字位置、提示词的遵循程度上大幅提升，超过 DALL-E 3 和 Midjourney v6 等行业领先模型。目前 SD3 技术还未完全开源，但 Stability AI 承诺，对于普通用户，SD3 模型不会收费。

Reka Core 登场，比肩 GPT-4、Claude 3

4 月 16 日，由前 DeepMind、Google Brain 和 FAIR 成员组成的 AI 初创公司 Reka 推出与 GPT-4 匹敌的多模态大模型 Reka Core，具备理解影像、音频和视频的能力，支持 32 种语言，性能可与 GPT-4 和 Claude 3 Opus 匹敌。不过，Reka 没有计划开源此模型。

AI 界前线

OpenAI 在东京开设亚洲首个办事处

4 月 15 日，OpenAI 宣布在日本东京设立亚洲首个办事处，承诺与政府、当地企业及研究机构合作，开发安全的 AI 工具满足本地需求。同时，OpenAI 还宣布推出一款专为日本语言优化的 GPT-4 定制模型，其在翻译和总结日语文本方面表现出色，性能和速度都有显著提升，成本效率更高，速度提升至原来的三倍。

波士顿动力推出电动版 Atlas 机器人

当地时间 4 月 17 日，在宣布原液压版 Atlas 人形机器人退役的一天后，波士顿动力推出全电动版本的 Atlas 机器人。

电动 Atlas 动作的自由度和灵活性远超人类。它继承了液压版的三指设计，采用比其前身更加流线型的设计，有着更灵活的机械骨架，具有类似环形灯的头部，没有任何电缆外露。

△图源：波士顿动力

英特尔推出全球最大神经拟态系统，比人腦快 200 倍

当地时间 4 月 17 日，美国芯片巨头英特尔（Intel）公司宣布，其已经建立了世界上最大的神经拟态系统 Hala Point，拥有 11.5 亿个神经元和 1280 亿个突触，速度最高可达人腦的 200 倍。该系统系统最初部署在桑迪亚国家实验室，采用英特尔 Loihi 2 处理器，旨在支持未来类腦 AI 的研究。

文心一言 4.0 工具版上新，还发了三大 AI 开发工具

4 月 16 日，在 2024 百度 Create AI 开发者大会上，百度正式宣布基础模型全面更新，并推出文心一言 4.0 工具版，包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和模型定制工具 ModelBuilder，以对应不同的开发场景。

贾佳亚团队 Mini-Gemini 全开源

香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini，提供从 2B 到 34B 的模型大小范围，融合 ChatGPT+DALL · E 3，具备更高清影像的精确理解、更高质量的训练数据、更强的影像解析推理能力，还能结合影像推理和生成。目前，Mini-Gemini 从代码、模型到数据已全部开源，线上 Demo 也已发布。

联想官宣 5 款 AI PC

4 月 18 日，联想 TechWorld 2024 在上海开幕。联想发布了内嵌个性化 AI 智能体 " 联想小天 " 的 AI PC 系列产品。用户可基于自然语言与 " 小天 " 互動，" 小天 " 在互動中也能不断完善。官方演示中，" 小天 " 具备可实现通过自然语言找到照片、AI 跨端生图等本地化 AI 能力。

融资动态

芯片初创公司 Rivos 融资 2.5 亿美元

4 月 17 日消息，RISC-V 芯片初创公司 Rivos 宣布在 A-3 轮融资中筹集了超过 2.5 亿美元，该笔资金将专项用于研发其首款针对生成式 AI ( ) 和数据分析工作负载的加速器产品。Matrix Capital 为本轮最大投资者管理层，英特尔资本、联发科（MTK）、Cambium Capital、CIDC、Capital TEN 以及 Hotung Venture Group 等投资机构也积极参与了此次融资。

微软将向阿联酋 AI 公司 G42 投资 15 亿美元

4 月 16 日，微软表示将向总部位于阿联酋的人工智能公司 G42 投资 15 亿美元，让这家美国科技巨头获得 G42 的少数股权和董事会席位。G42 将在微软的云计算平台 Azure 上运行，为全球公共部门客户和大型企业提供先进的人工智能解决方案。

新玩意

Rewind 宣布更名 Limitless，推出可穿戴 AI 挂坠

4 月 17 日，Rewind 更名为 Limitless，推出用于会议场景的可穿戴 AI 挂坠，具备提供实时笔记、会议转录和会议摘要等功能，预计将在 8 月发售，售价 99 美元。Limitless 为用户配备 " 同意模式 "，以确保隐私保护和加密云服务确保数据私密性，用户可控制数据解密。

△图源：Limitless

前沿研究

Meta 实现无限上下文长度的新算法

Meta 联合南加州大学、CMU、UCSD 的研究人员近期发布了论文，提出一种名为 Megalodon 的算法。这是一种新型神经网络架构，能够高效处理具有无限上下文长度的文本。Megalodon 引入了多项创新组件，显著提高了模型的能力、稳定性，以及训练的性价比，并在多个基准测试中表现出优于 Llama2 的性能。

微软推出单图生数字人技术 VASA-1

4 月 18 日，微软发布 VASA-1 技术，能通过单张图片和音频生成逼真的数字人视频。VASA-1 利用面部动态统一编码和 Diffusion Transformer 技术，实现精准的唇语同步和自然的表情动作，并支持实时生成。