今天小编分享的互联网经验:Open AI创始人赴中东千亿美元融资、三星计划公布类ChatGPT AI、Hugging Face获 2亿美元D轮融资,欢迎阅读。
作者:子渝
编辑:沈筱
Meta 联手 CMU 打造「通用机器人智能体」RoboAgent
8 月 21 日消息,Meta 和 CMU 联合研究团队耗时两年,成功开发出了一款名为 RoboAgent 的通用机器人智能体。RoboAgent 仅仅通过 7500 个轨迹的训练就实现了 12 种不同的复杂技能,通过离线添加不同变化的场景来增加数据集,并使用动作分块 Transformer 模型来处理多任务数据。这些复杂任务包括烘焙、拾取物品、上茶、清洁厨房等,并能在 100 种未知场景中泛化应用。
https://www.chinaz.com/2023/0821/1552733.shtml
英国计划斥资 1.3 亿美元购买数千颗高性能人工智能芯片
8 月 21 日消息,据外媒报道,为了在全球计算能力竞赛中迎头赶上,英国首相里希 · 苏纳克(Rishi Sunak)计划斥资 1.3 亿美元(1 亿英镑)购买数千颗高性能人工智能(AI)芯片。据外媒报道,这笔资金将用于向芯片制造商英伟达、AMD 和英特尔订购芯片。据悉,英国科学资助机构英国研究与创新(UK Research and Innovation)已进入订购 5000 个英伟达 GPU 的后期阶段。
http://www.techweb.com.cn/world/2023-08-21/2932344.shtml
英伟达和 VMWare 合作推出定制化 AIGC 服务
8 月 22 日,英伟达和軟體制造商 VMWare 周二扩大了合作伙伴关系,两家公司宣布,将合作开发新的軟體平台,为更多企业带来更加安全的定制化生成式人工智能 ( AI ) 服务。这些模型将使用客户独有的数据来创建供内部使用的私有人工智能模型。英伟达表示,为支持这项服务,戴尔、惠普和联想生产的支持人工智能的伺服器预计将在今年年底推出,这些伺服器使用英伟达的企业軟體、L40S 图形处理单元和 BlueField-3 数据处理单元。
https://blogs.nvidia.cn/2023/08/22/vmware-and-nvidia-unlock-generative-ai-for-enterprises/
钉钉宣布开放 AI PaaS,多产品线与场景接入大模型
8 月 22 日,2023 钉钉生态大会在上海张江科学会堂举行,这次大会,钉钉宣布开放智能化底座能力 AI PaaS,这标志着钉钉智能化进入生态层;同时公布了钉钉智能化的最新进展:已有 17 条产品线、55 个场景全面接入大模型。钉钉还尝试着给出了行业内首个大模型落地应用场景的商业化方案,在原有收费版钉钉的基础上配置大模型调用额度,根据测算,调用一次大模型不到 5 分钱。
https://www.ithome.com/0/714/406.htm
DeepMind 推出强化学习算法 ReST,使 LLM 输出与人类偏好更一致
8 月 22 日消息,DeepMind 推出了一种新的强化学习算法 ReST,目的是使大语言模型(LLM)的输出与人类偏好更为一致。ReST 的核心是将数据集增长和策略改進帳为两个离线阶段。实验结果显示,ReST 在机器翻译任务上表现卓越,显著提高了翻译质量,且与在线 RL 方法相比,ReST 在人类评分上更胜一筹。
https://finance.sina.com.cn/tech/roll/2023-08-22/doc-imziaace4562397.shtml
昆仑万维发布 AI 搜索产品 " 天工 AI 搜索 "
8 月 23 日消息,昆仑万维今日宣布,正式推出国内第一款融入大语言模型的搜索引擎 —— 天工 AI 搜索,并开启内测申请。据官方介绍,传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范围,并匹配可能符合用户意图的海量信息。而基于大模型能力的 AI 搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案。
https://www.ithome.com/0/714/236.htm
Hugging Face 获 2 亿美元 D 轮融资,Salesforce 领投
8 月 23 日消息,开源模型库公司 Hugging Face 获 2 亿美元 D 轮融资,本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在其 X 上证实了这一消息。本轮融资完成后,Hugging Face 估值将达 40 亿美元,相比去年 5 月由 Lux Capital 领投,红杉资本、Coatue Management 跟投 1 亿美元的 C 轮融资,其估值增长了一倍。
https://www.36kr.com/p/2400225043013763
IBM 在中国启动新一代 AI 与数据平台 watsonx
8 月 23 日,IBM 在北京召开新闻发布会,宣布启动新一代 AI 与数据平台 IBM watsonx 在本地市场落地,为企业级基础模型和生成式 AI 提供动力。这是继红帽 OpenShift 开放式混合云技术平台之后,IBM 落地大中华区市场的又一个具有里程碑意义的开放式 AI 技术平台。与 IBM 混合云平台一样,watsonx 也是基于领先的企业级开放技术,也是以平台的方法,通过构建和扩展广泛而强大的生态,把 IBM 从存力、算力、企业级 AI 应用到咨询服务的全栈能力,以及源自 IBM 研究院的前沿 AI 创新技术(如基础模型与生成式 AI),交到企业手中。
https://china.newsroom.ibm.com/2023-08-23-IBM-watsonx,-AI
Meta 发布 AI 模型 SeamlessM4T,可转录和翻译近百种语言
8 月 22 日消息,Meta 发布了一种能够翻译和转录数十种语言的人工智能模型 —— SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的 " 语音到语音 " 和 " 语音到文本 " 领網域的 " 重大突破 "。该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。
https://techcrunch.com/2023/08/22/meta-releases-an-ai-model-that-can-transcribe-and-translate-close-to-100-languages/
Meta 推出 AI 编程工具 Code Llama
8 月 24 日消息,Meta 现推出了名为 Code Llama 的 AI 编码工具,号称 " 最先进的大型编码语言模型 "。该模型基于 Llama 2 大型语言模型打造,可以理解为 "Llama 2 的写代码专用版 ",可用于 " 生成新的代码并调试人类编写的工作 ",目前已上线 Github。Meta 指出,Code Llama 能够根据代码自然语言提示 / 要求生成用户想要的代码和有关代码的自然语言,或者在指向特定代码时进行完善和调试。除了基础版的 Code Llama 外,Meta 还推出了专为 Python 设计的版本 —— Code Llama-Python,以及一个能够理解自然语言指令的版本 —— Code Llama-Instrct。
https://techcrunch.com/2023/08/24/meta-releases-code-llama-a-code-generating-ai-model/
谷歌计划推出针对 Google Workspace 的 AI 驱动安全增强功能
8 月 24 日消息,谷歌宣布将大幅增强 Google Workspace 产品的安全能力,特别是利用人工智能防止企业云数据的泄露。谷歌表示,将在云硬碟 Drive 中利用 AI 技术实现对敏感企业数据的自动分类及标记,并可設定基于风险级别的不同数据访问控制,从而有效防止企业敏感数据的泄露。同时,Gmail 也将新增数据丢失防护功能,帮助企业管理员更好地阻止用户无意间通过邮件发送敏感数据。
https://techcrunch.com/2023/08/23/google-plans-to-bring-ai-fueled-security-enhancements-to-google-workspace/
OpenAI 与 Scale AI 合作,支持企业使用专有数据训练模型
8 月 24 日消息,OpenAI 近日宣布,和数据标注服务初创公司 Scale AI 展开深度合作,将 Scale AI 的微调工具和 OpenAI 的 GPT-3.5 文本生成模型结合在一起,允许企业使用其专有数据来训练模型并大规模运行,使开发人员能够针对特定任务定制微调 AI 模型。
https://www.ithome.com/0/714/936.htm
Open AI 寻求中东千亿美元融资
8 月 24 日消息,据创投圈知情人士透露,OpenAI 首席执行官山姆 · 奥特曼下半年奔赴阿联酋首都阿布扎比等地寻求融资,不低于千亿美元。据悉,山姆奥特曼描述 OpenAI 的目标可能是要实现比人类更高级的智能。但要实现 Super intelligence(超级智能)这一目标,还非常遥远,OpenAI 需要的资金规模不可想象。
https://new.qq.com/rain/a/20230824A01F8100
联发科将推出新一代旗舰移动芯片,支持由 Llama 2 模型开发的 AI 应用
8 月 24 日,MediaTek 宣布利用 Meta 新一代开源大语言模型(LLM)Llama 2 以及 MediaTek 先进的 AI 处理器(APU)和完整的 AI 开发平台(NeuroPilot),建立完整的终端侧 AI 计算生态。MediaTek 将于年末推出新一代旗舰移动芯片,采用针对 Llama 2 模型而优化的軟體栈(NeuroPilot),与搭配支持 Transformer 模型做骨干网络加速的更新版 AI 处理器(APU),可减少动态随机存取内存(DRAM)的读写消耗和带宽占用,进一步强化大语言模型和生成式 AI 应用的性能。预计年末采用 MediaTek 新一代天玑旗舰移动芯片的智能手机支持由 Llama 2 模型开发的 AI 应用,可为用户带来生成式 AI 应用体验。
https://corp.mediatek.cn/news-events/press-releases/mediatek-leverages-metas-llama-2-to-enhance-on-device-generative-ai-in-edge-devices
韩国互联网巨头 Naver 推出生成式 AI 服务平台
8 月 24 日 消息,韩国最大搜索引擎 Naver 推出自己的生成式人工智能服务 HyperCLOVA X,该产品包含聊天机器人应用程式 CLOVA X,旨在改进网络搜索、在线购物和导航服务,核心是将为用户提供生成式人工智能驱动的搜索功能,并为企业客户提供新的定制服务。Naver 将从 8 月 24 日开始 CLOVA X 的公开测试,9 月启动 Cue 的测试。Naver 及其国内竞争对手正着眼于美国和中国科技巨头尚未涉足的细分市场。例如, Naver 希望为政治敏感的中东国家以及非英语国家和地区如日本和东南亚开发本地化的 AI 应用。
https://techcrunch.com/2023/08/24/koreas-internet-giant-naver-unveils-generative-ai-services/
好未来正式推出数学领網域千亿级大模型 MathGPT
8 月 24 日,在好未来 20 周年直播活动中,CTO 田密宣布好未来自研的数学领網域千亿级大模型 MathGPT 正式推出并开启内测。MathGPT 是由好未来在今年 5 月公布的其公司自研数学大模型,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领網域的大模型,也是国内首个专为数学打造的大模型。MathGPT 在多项基准测试中表现超越 GPT-4,刷新了 SOTA 记录。
https://www.chinaz.com/2023/0824/1553665.shtml
三星计划公布类 ChatGPT AI
8 月 24 日消息,近日,根据外媒报道,三星计划在 9 月 12 日举办的 Real Summit 2023 活动中,展示自家的类 ChatGPT 生成式 AI。据悉,该 AI 现阶段将主要为三星内部员工提供服务,带来诸如化编程代码、撰写电子邮件、记录文档摘要等功能。这将有效提升三星员工的工作效率。
http://www.techweb.com.cn/it/2023-08-24/2932535.shtml
小红书旗下公司新增 AI 軟體业务
8 月 24 日消息,天眼查 App 显示,近日,小红书科技(珠海横琴)有限公司发生工商变更,经营范围新增数字技术服务、人工智能应用軟體开发、人工智能基础軟體开发、軟體销售、珠宝首饰批发、汽车零配件批发等。该公司成立于今年 6 月,注册资本 5100 万人民币,法定代表人为王晓博,由小红书科技有限公司全资持股。
https://www.donews.com/news/detail/8/3660907.html
阿里巴巴国际站发布外贸 AI 产品
8 月 24 日,外贸行业首个 AI 应用落地,阿里国际站发布全链路 AI 产品。据悉,该产品与数字外贸全链路紧密结合,包含生意助手和 OKKI AI 两大服务,拥有智能商品发布与管理、市场分析、客户接待、视频聊天实时翻译、企业管理等多项功能,覆盖外贸生意所有环节。这是 AI 在外贸产业中的首次全面应用,将让 AI 真正成为每个出海企业的帮手。
https://www.sohu.com/a/714430368_114984
阿里云开源多模态视觉模型 Qwen-VL,新增视觉定位等能力
8 月 25 日消息,阿里云推出了大规模视觉语言模型 Qwen-VL,目前已经在 ModeScope 开源。阿里云此前已经开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。据悉,Qwen-VL 是一款支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的 VL 模型,其除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、影像中文字理解等能力。
https://www.alizila.com/alibaba-cloud-launches-open-source-models-that-understand-image-content/
奇安信发布 Q-GPT 安全机器人和大模型卫士
8 月 25 日消息,奇安信集团发布 Q-GPT(奇安信大模型)安全机器人和大模型卫士。据介绍,Q-GPT 安全机器人是基于奇安信大模型的 " 虚拟安全专家 ",可以全天候工作,一台机器人等于 60 多位安全专家,可产生约 2000 万元的运营效益,极大提升了生产力。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源、大模型应用分析等为一体,帮助企业更安全的向大模型要生产力。
http://www.techweb.com.cn/internet/2023-08-25/2932616.shtml
澜舟科技正式发布百亿参数大模型 " 孟子 GPT-40B"
8 月 28 日消息,澜舟科技旗下国产百亿大模型孟子 GPT-40B 昨日正式发布,参数数量达到 400 亿,各项任务平均提升 10-15%。孟子 GPT-40B 在中文及多语言能力、写作、多轮对话等方面都有提升,接近 ChatGPT-3.5 的水平。澜舟科技还同步发布了基于孟子 GPT 的金融大模型和会议内容分析平台 " 澜舟智会 ",未来将提供基础模型、大模型训练框架 / 工具包等服务。
https://www.chinaz.com/2023/0828/1554296.shtml