Arm正式IPO，Meta计划对标GPT-4训练下一代大模型，Adobe Firefly 生成式 AI 模型全面开放商用

今天小编分享的互联网经验：Arm正式IPO，Meta计划对标GPT-4训练下一代大模型，Adobe Firefly 生成式 AI 模型全面开放商用，欢迎阅读。

作者：子渝

编辑：沈筱

微软发布 1.3B 参数量小模型，效果优于 7B 参数 Llama2

9 月 11 日，微软发布开源模型 phi-1.5，在只支持代码的 1.0 版本之上加入了一般场景对话。该模型的参数量只有 1.3B，但效果已经超过了拥有 7B 参数的 Llama2。phi 团队一致认为，数据的质量远比数量更重要。所以与一众卷参数量的模型相比，phi-1.5 不仅参数量不到 Llama2 的五分之一，训练时所用的 token 更是少了一个数量级，只用了 3 千亿的训练数据。但 phi-1.5 在 AGIEval、 LM-Eval 等多个 Benchmark 上都取得了比 Llama2 还要优异的成绩。

https://www.sohu.com/a/721106310_610300

英伟达 GH200 超级芯片首次亮相 MLPerf v3.1，性能跃升 17%

9 月 11 日，推出不到两个月的英伟达 GH200 Grace Hopper 超级芯片首次亮相 MLPerf 行业基准测试。在此次测试中，具有更高的内存带宽和更大的内存容量的 GH200 与 H100 GPU 相比，性能高出 17%。此次 MLPerf Inference v3.1 基准测试是继 4 月发布 3.0 版本之后的又一次更新，这次更新包含了两个方面：引入基于 60 亿参数大语言模型 GPT-J 的推理基准测试（AI 模型的大小通常根据它有多少参数来衡量）和改进的推荐模型。

https://www.thepaper.cn/newsDetail_forward_24580685

Meta 计划对标 GPT-4 训练下一代大模型

9 月 11 日消息，Meta 购入大量英伟达 H100 芯片，并积极扩建数据中心，减少对微软 Azure 云平台的依赖，以创建一款更为强大、复杂的聊天机器人。Meta 将 GPT-4 作为其下一个 AI 模型的标准，并计划在 2024 年开始训练，旨在模仿人类的表情和感情，提供更加逼真的互動体验。根据此前泄露的消息，Instagram 正在测试一个具有 30 种性格的聊天机器人，可能与公司即将推出的未公布的人工智能 " 角色 " 相关联。

https://new.qq.com/rain/a/20230911A04IZL00

字节跳动旗下 " 悟空搜索 "App 更名 " 小悟空 "，提供 200+AI 工具

9 月 11 日消息，字节跳动于去年推出 " 悟空搜索 "App，主打 " 无广告搜索 "。现在，这款 App 宣布更名为 " 小悟空 "。小悟空 App 内包含基于大语言模型的 AI 工具合集，支持智能对话和辅助推荐功能。智能工具分类包括创作生成、学习提升、工作职场、专业咨询、虚拟角色、休闲娱乐等，用户可以使用该工具进行翻译、法律咨询、趣味测试等操作。

https://www.ithome.com/0/718/425.htm

研究发现 ChatGPT 可在七分钟内完成軟體开发，平均成本不足 1 美元

9 月 12 日消息，来自布朗大学和多所中国大学的研究团队进行了一个实验，探究是否可以用 ChatGPT 的 3.5 版本的语言模型来驱动的人工智能机器人，在没有事先训练的情况下完成軟體开发过程。研究者创建了一个假想的軟體开发公司，名为 ChatDev。研究表明，这个由人工智能驱动的公司平均可以在不到七分钟内以不到一美元的成本完成整个軟體开发过程，同时通过其 " 记忆 " 和 " 自我反思 " 的能力识别和解决 " 潜在漏洞 "。

https://www.ithome.com/0/718/638.htm

国内外高校联合开源强化学习策略，让机器狗能跑酷

9 月 12 日消息，来自上海期智研究院、斯坦福大学、上海科技大学、卡内基梅隆大学和清华大学的研究者联合开展了一个项目，旨在通过开源强化学习策略让机器狗掌握多样化的通用技能，以迅速应对各种场景和障碍。该项目基于一种新的开源系统，可以学习基于视觉的端到端跑酷策略，无需依赖任何参考动作数据。这种强化学习方法能够让机器狗学会攀爬高障碍、跳过大间隙、在低障碍下爬行、挤过狭小缝隙和跑步等技能，并将这些技能整合成一个基于视觉的跑酷策略，可以直接部署到四足机器人上。

https://new.qq.com/rain/a/20230912A04MBX00

用户反映 llama2.mojo 实现比 llama2.c 快 20% 的效果

9 月 12 日消息，一名 Mojo 社区成员将 Python 程式 llama2.py 移植到 Mojo 上，实现了比原版 llama.c 快 20% 的效果，显示了 Mojo 在硬體级优化方面的巨大潜力。Mojo 是一种新的面向 AI 开发人员的编程语言，其目标是将 Python 的易用性与系统编程功能结合，实现高性能计算。Mojo 可以无缝集成 Python 代码和库，同时提供与 C++ 和 CUDA 相匹配的性能。Mojo 的发明者 Chris Lattner 表示，他创立的公司 Modular 新获得的 1 亿美元融资将用于推动 Mojo 的进一步发展和产品扩展。

https://finance.sina.com.cn/tech/roll/2023-09-12/doc-imzmmpkq5281189.shtml

腾讯健康公布医疗大模型，并发布 AI 医疗产品矩阵

9 月 12 日消息，据腾讯健康官方公众号报道，腾讯健康在日前公布了旗下医疗大模型，并发布 " 智能问答、家庭医生助手、数智医疗影像平台等多场景 AI 产品矩阵 "，以及药物发现平台 " 云深 "（iDrug）。这一医疗大模型基于腾讯混元大模型，适用于文案生成、智能问答、病历结构化和检索、影像报告和辅助诊断等场景，可嵌入医疗环节全流程；同时，在 AI 驱动药物发现方面，腾讯宣称，旗下 " 云深 "（iDrug）平台已同时具备了小分子药物与大分子药物的加速发现能力。

https://www.ithome.com/0/718/473.htm

Adobe Firefly 生成式 AI 模型全面开放商用

9 月 13 日消息，Adobe 宣布，经过几个月的测试，Firefly 生成式 AI 模型已正式上线，可在 Adobe Creative Cloud、Adobe Express 和 Adobe Experience Cloud 等多个应用中使用。此外，Adobe 还推出了一个独立的 Firefly 网页应用，让用户在不使用特定的 Adobe Creative Suite 应用的情况下，也可以体验生成式 AI 的功能。

https://www.ithome.com/0/718/969.htm

华人团队提出 Medusa 简单框架，可将 LLM 推理速度提高 2 倍

9 月 13 日消息，来自普林斯顿、UIUC 等机构的华人团队提出一个用于加速大型语言模型（LLM）推理速度的简单框架 Medusa，并于 9 月 12 日开源发布。Medusa 通过增加多个解码头来加速模型的推理速度，而无需引入额外的草稿模型，这种方法允许研究人员在单个 GPU 上微调大模。测试结果显示，Medusa 可以将 LLM 的生成效率提高约 2 倍。

https://www.chinaz.com/2023/0913/1558833.shtml

清华联合北邮和微信团队推出多智能体宇宙，可模拟各类社会实验场景

清华大学联合北邮和微信团队推出了一个名为 "AgentVerse" 的多智能体宇宙，专门针对大语言模型开发，已在 GitHub 获得 1.1k 星标。该项目简化了使用大语言模型构建自定义多智能体环境的过程，只需几行简单配置即可模拟各种社会实验场景，如 " 囚徒困境 " 和 "NLP 课堂 "。

https://www.thepaper.cn/newsDetail_forward_24583658

阿里云通义千问 AI 大模型已通过备案，正式向公众开放

9 月 13 日消息，阿里云今日宣布通义千问大模型已首批通过备案，并正式向公众开放。目前，OPPO、得物、钉钉、淘宝、浙江大学等已与阿里云达成合作，基于通义千问训练自己的专属大模型或开发大模型应用。

https://www.ithome.com/0/718/755.htm

知网推出 "AIGC 检测服务系统 "，用以识别学术文本中 AI 生成内容

9 月 13 日消息，同方知网官网今日发布公告，宣布全新推出 "AIGC 检测服务系统 "，号称历时半年，探索 AIGC 运行规律并攻克内容识别、算法效率、可信评估等技术难题，经大数据测试、检测效果验证、检测效率调优等服务优化改进。首次提出 " 知识增强 AIGC 检测技术 " 和若干检测算法，从语言模式和语义逻辑两条链路，用 AI 对抗 AIGC，最终实现识别学术文本中的 AI 生成内容。

https://www.ithome.com/0/718/925.htm

Stability AI 发布文本生成音频产品 Stable Audio

9 月 14 日消息，Stability AI 公司近日推出 Stable Audio，可基于用户输入的文本内容，自动生成多种类型和风格的音频内容，包括音乐、语音、环境声、特效等。Stability AI 宣称，Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频，并且只需要一个 NVIDIA A100 GPU。

https://new.qq.com/rain/a/20230914A015WO00

谷歌被曝小范围测试 Gemini，比训练 GPT-4 算力大 5 倍

9 月 15 日消息，据三位直接知情人士透露，谷歌已经允许一小部分公司使用 Gemini 軟體的早期版本，意味着谷歌即将将其纳入消费者服务，并通过公司的云计算服务出售给企业；同时，Gemini 已开始在新的 TPUv5 Pod 上进行训练，算力高达～1e26 FLOPS，比训练 GPT-4 的算力还要大 5 倍；另外，Gemini 的训练数据库为 Youtube 上 93.6 亿分钟的视频字幕，总数据集大小约为 GPT-4 的两倍。

https://36kr.com/p/2432997666886022

微软开源 EvoDiff，用 AI 生成蛋白质框架

9 月 15 日消息，微软开源了一个蛋白质生成框架 EvoDiff。该框架使用 AI 技术，能够在没有目标蛋白质结构信息的情况下，生成生成高保真、多样化的蛋白质序列。EvoDiff 的核心是一个拥有 6.4 亿参数的模型，该模型通过使用来自不同物种和功能类别蛋白质的数据进行训练，使模型具备生成高质量蛋白质序列的能力。创新之处在于，它不再依赖蛋白质结构信息，而是基于蛋白质序列来生成蛋白质。

https://www.kejixun.com/article/582034.html

Arm 正式 IPO，上市首日大涨近 25%

9 月 14 日，作为今年目前最大 IPO，英国芯片设计公司 ARM 正式登录纳斯达克，首日涨超 25%，市值达 650 亿美元。当今几乎所有的手机芯片，都是基于 ARM 的架构设计的，除此之外，ARM 架构在汽车、智能手表等行业也有较高的市占率。ARM 表示，由于数据中心和人工智能芯片需求的推动，预计本财年收入增长 11%，2025 财年收入增长率能达到 20% 左右。

https://36kr.com/p/2432884592546432

字节团队发布两个 AI 视频项目，可实现多模态动画生成和文本视频编辑

9 月 15 日消息，字节团队在 Github 上发布两个 AI 视频项目。一个是 MagicAvatar，主多模态动画生成，可以将文本、视频和音频等不同输入方式转化为动作信号，从而生成和动画化一个虚拟人物；另一个是 MagicEdit，专注文本导向的视频编辑，用户进行自然语言提示，就可改变视频风格、场景甚至替换视频里的对象或添加元素。目前在 Github 上，两个项目加起来已经拿到 1000+ 星。

https://36kr.com/p/2417388284961540

百度希壤与高通达成战略合作，拟打造元宇宙基础设施平台

9 月 15 日消息，近期，北京百度网讯科技有限公司与高通无线通信技术（中国）有限公司在北京签署非约束性战略合作谅解备忘录，将在 XR 领網域展开全面战略合作。通过此次战略合作的宣布，双方期望在未来开展深度的技术、市场与生态合作，其中包括双方将在 XR 技术、生成式 AI、数字人、产业上下游协同等方面，围绕元宇宙 + 生态 + 行业应用共同打造新一代元宇宙基础设施平台。

https://www.chinaz.com/2023/0915/1559598.shtml

国内多个 AI 绘画网站疑因违规关停

9 月 15 日消息，国内多个基于 AIGC 技术建立的 AI 绘画网站突然下线。目前，像广大网友熟知的四必三、哩布哩布等纷纷在无预警情况下被关停，或转移到境外網域名，并在国内无法正常访问。不少网友怀疑合规方面或出现问题。

https://mp.weixin.qq.com/s/HdwLkkhyD6OWlO4gUppVuQ

快手开启 AI 文生图功能内测

9 月 15 日，快手宣布在短视频评论区开始内测 AI 文生图功能 —— 快手 AI 玩评，用户通过输入各种创意文字，可一键生成海量风格图片，更便捷地在评论区进行趣味互动。据悉，这是继快手 AI 对话之后，快手在短视频场景内探索并落地的又一 AIGC 能力，这也是业内首次在大型 App 核心业务场景评论区下应用的 AIGC 能力。

https://www.ithome.com/0/719/336.htm