今天小编分享的互联网经验:本周(4.15-4.21)AI界发生了什么?,欢迎阅读。
文|赵炜嘉
编辑|邓咏仪
大佬言论
李彦宏:开源模型将会越来越落后
4 月 16 日,百度创始人、董事长兼首席执行官李彦宏在 Create 2024 百度 AI 开发者大会上表示,未来,自然语言将成为新的通用编程语言,每个人都可以成为一名开发者,用自己的创造力改变世界。李彦宏还指出," 大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以,开源模型会越来越落后。"
扎克伯格:80 亿的 Llama 3 还不够小,大模型需要提升训练质量
4 月 18 日,Llama 3 正式发布后,扎克伯格在知名主持人 Dwarkesh Patel 的播客中,谈及 Meta AI 的技术路线、未来规划和开源哲学。扎克伯格表示:Llama 3 最小版本的 80 亿参数模型 " 还不够小 ",无法满足大量使用场景。他更倾向于将模型蒸馏到 5 亿、10 亿级别,看看能用来做什么。
李飞飞报告:中国大模型世界第二,但专利数、机器人全球第一
4 月 15 日,由华裔女科学家、" 人工智能教母 " 李飞飞联合领导的 HAI 研究所(Stanford HAI)近日发布了《2024 年人工智能指数报告》。
报告中指出,2023 年,61 个著名的人工智能模型源自美国的机构,超过欧盟的 21 个和中国的 15 个。 然而,中国依然是美国最大的竞争对手,中国的机器人安装量居世界首位;同样,世界上大多数人工智能专利(61%)都来自中国。
△图源:HAI
另外,4 月 18 日,李飞飞在拜登的国情咨文演讲中呼吁,希望拜登政府出资建设一个国家计算能力和数据集仓库。她指出,当前 AI 学术界明星人才正大量流失,大公司正在以高薪挖掘学术界人才资源。而研究大模型的高昂成本正在将研究人员排除在该领網域之外,从而损害了学术界的独立研究。
大事件
Meta 开源新一代模型 Llama 3
当地时间 4 月 18 日,Meta 公司宣布最新开源推出新一代大型语言模型 Llama 3,包含 8B 和 70B 两种参数规模。Llama 3 在由 24000 块 GPU 组成的定制集群上,使用 15 万亿个 token 训练的,上下文长度实现 8K,推理编码大幅提升,代码和权重全开源。Llama 3 现可在网页版 Meta AI 免登录使用。
Stable Diffusion 3 API 发布
4 月 17 日,Stability AI 正式发布 Stable Diffusion 3 API,新的 SD3 在文字位置、提示词的遵循程度上大幅提升,超过 DALL-E 3 和 Midjourney v6 等行业领先模型。目前 SD3 技术还未完全开源,但 Stability AI 承诺,对于普通用户,SD3 模型不会收费。
Reka Core 登场,比肩 GPT-4、Claude 3
4 月 16 日,由前 DeepMind、Google Brain 和 FAIR 成员组成的 AI 初创公司 Reka 推出与 GPT-4 匹敌的多模态大模型 Reka Core,具备理解影像、音频和视频的能力,支持 32 种语言,性能可与 GPT-4 和 Claude 3 Opus 匹敌。不过,Reka 没有计划开源此模型。
AI 界前线
OpenAI 在东京开设亚洲首个办事处
4 月 15 日,OpenAI 宣布在日本东京设立亚洲首个办事处,承诺与政府、当地企业及研究机构合作,开发安全的 AI 工具满足本地需求。同时,OpenAI 还宣布推出一款专为日本语言优化的 GPT-4 定制模型,其在翻译和总结日语文本方面表现出色,性能和速度都有显著提升,成本效率更高,速度提升至原来的三倍。
波士顿动力推出电动版 Atlas 机器人
当地时间 4 月 17 日,在宣布原液压版 Atlas 人形机器人退役的一天后,波士顿动力推出全电动版本的 Atlas 机器人。
电动 Atlas 动作的自由度和灵活性远超人类。它继承了液压版的三指设计,采用比其前身更加流线型的设计,有着更灵活的机械骨架,具有类似环形灯的头部,没有任何电缆外露。
△图源:波士顿动力
英特尔推出全球最大神经拟态系统,比人腦快 200 倍
当地时间 4 月 17 日,美国芯片巨头英特尔(Intel)公司宣布,其已经建立了世界上最大的神经拟态系统 Hala Point,拥有 11.5 亿个神经元和 1280 亿个突触,速度最高可达人腦的 200 倍。该系统系统最初部署在桑迪亚国家实验室,采用英特尔 Loihi 2 处理器,旨在支持未来类腦 AI 的研究。
文心一言 4.0 工具版上新,还发了三大 AI 开发工具
4 月 16 日,在 2024 百度 Create AI 开发者大会上,百度正式宣布基础模型全面更新,并推出文心一言 4.0 工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和模型定制工具 ModelBuilder,以对应不同的开发场景。
贾佳亚团队 Mini-Gemini 全开源
香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini,提供从 2B 到 34B 的模型大小范围,融合 ChatGPT+DALL · E 3,具备更高清影像的精确理解、更高质量的训练数据、更强的影像解析推理能力,还能结合影像推理和生成。目前,Mini-Gemini 从代码、模型到数据已全部开源,线上 Demo 也已发布。
联想官宣 5 款 AI PC
4 月 18 日,联想 TechWorld 2024 在上海开幕。联想发布了内嵌个性化 AI 智能体 " 联想小天 " 的 AI PC 系列产品。用户可基于自然语言与 " 小天 " 互動," 小天 " 在互動中也能不断完善。官方演示中," 小天 " 具备可实现通过自然语言找到照片、AI 跨端生图等本地化 AI 能力。
融资动态
芯片初创公司 Rivos 融资 2.5 亿美元
4 月 17 日消息,RISC-V 芯片初创公司 Rivos 宣布在 A-3 轮融资中筹集了超过 2.5 亿美元,该笔资金将专项用于研发其首款针对生成式 AI ( ) 和数据分析工作负载的加速器产品。Matrix Capital 为本轮最大投资者管理层,英特尔资本、联发科(MTK)、Cambium Capital、CIDC、Capital TEN 以及 Hotung Venture Group 等投资机构也积极参与了此次融资。
微软将向阿联酋 AI 公司 G42 投资 15 亿美元
4 月 16 日,微软表示将向总部位于阿联酋的人工智能公司 G42 投资 15 亿美元,让这家美国科技巨头获得 G42 的少数股权和董事会席位。G42 将在微软的云计算平台 Azure 上运行,为全球公共部门客户和大型企业提供先进的人工智能解决方案。
新玩意
Rewind 宣布更名 Limitless,推出可穿戴 AI 挂坠
4 月 17 日,Rewind 更名为 Limitless,推出用于会议场景的可穿戴 AI 挂坠,具备提供实时笔记、会议转录和会议摘要等功能,预计将在 8 月发售,售价 99 美元。Limitless 为用户配备 " 同意模式 ",以确保隐私保护和加密云服务确保数据私密性,用户可控制数据解密。
△图源:Limitless
前沿研究
Meta 实现无限上下文长度的新算法
Meta 联合南加州大学、CMU、UCSD 的研究人员近期发布了论文,提出一种名为 Megalodon 的算法。这是一种新型神经网络架构,能够高效处理具有无限上下文长度的文本。Megalodon 引入了多项创新组件,显著提高了模型的能力、稳定性,以及训练的性价比,并在多个基准测试中表现出优于 Llama2 的性能。
微软推出单图生数字人技术 VASA-1
4 月 18 日,微软发布 VASA-1 技术,能通过单张图片和音频生成逼真的数字人视频。VASA-1 利用面部动态统一编码和 Diffusion Transformer 技术,实现精准的唇语同步和自然的表情动作,并支持实时生成。
△图源:微软