今天小编分享的科技经验:AI大模型“国家队”定了,欢迎阅读。
全文共计 4673 字,预计阅读时间 8 分钟
编辑 | 蒲蒲
我国大模型 " 国家队 " 已完成首次 " 选拔组队 "。
百度、华为、阿里等入局
近日,在 2023 世界人工智能大会(WAIC2023)上,国家标准委指导的国家人工智能标准化总体组宣布,我国首个大模型标准化专题组组长,由上海人工智能实验室与百度、360、华为、阿里等企业联合担任,现场进行了证书颁发并正式启动大模型测试国家标准制订。
这意味着百度、华为、阿里等入局了 " 大模型国家队 "。
公开资料显示,今年 5 月,国家启动大模型标准化工作,人工智能标准化总体组设立大模型专题组,启动大模型专题组组长、副组长申报和大模型标准化研究选题建议工作。大模型专题组将承担大模型标准化制订工作,目的是推动大模型技术和标准化的实践结合,促进人工智能产业健康发展。
大模型专题组组长要求在大模型理论研究和产业应用等方面具有较高专业水平,熟悉大模型领網域国际前沿科技发展态势、法规制度与标准规范等。联合组长部門需要发挥在大模型领網域的理论和实践经验,围绕大模型软硬體底座、关键技术、产业应用等重点领網域的突出问题提供标准化研究选题建议。
大模型内卷,百 "模" 大战开启
当前,中国大模型呈现蓬勃发展态势。近年来,中国大模型技术沿各技术路线迅速发展,在自然语言处理、机器视觉和多模态等领網域涌现出多个具有行业影响力的预训练大模型。
科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超 80%,美国在大模型数量方面居全球之首,中国目前则已进入大模型快速发展期,与美国保持同步增长态势。
据不完全统计,截止今年 5 月,中国 10 亿参数规模以上的大模型已发布 79 个。毫不夸张地说," 百模大战 " 已开启。IDC 预测,2026 年中国人工智能軟體及应用市场规模将达到 211 亿美元,人工智能将进入大规模落地应用关键期。科技企业们感觉到了 " 一日千里 "" 时不我待 "。
《报告》分析发现,中国自 2020 年进入大模型加速发展期,目前与美国保持同步增长态势。在自然语言处理、机器视觉和多模态等各技术分支上均在同步跟进、快速发展,涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。
《报告》显示,目前中国在 14 个省市 / 地区均有团队在开展大模型研发,北京、广东两地最多,地網域集中度相对较高。从领網域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领網域,其次是多模态领網域,在计算机视觉和智能语音等领網域的大模型还较少。国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,学术界与产业界之间的联合开发还不充分。
《报告》通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这 4 个地方也是近 3 年人工智能伺服器采购数量最多的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共智能算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。
《报告》分析发现,目前中国大模型产业化应用大致出现两种并行的发展路径,文心一言、通义千问、紫东太初等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。
与此同时,一批针对生物制药、遥感、气象等垂直领網域的专业类大模型,正在发挥其领網域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案。
根据腾讯研究院、同济大学、腾讯云、腾讯新闻共同发布的《人机共生——大模型时代的 AI 十大趋势观察》报告," 大模型 " 已可以在多个领網域催生出全新的商业价值,第一批跨功能的应用程式已在眼前:金融、零售、政府、制造、物流、地产、教育等多个行业,以及财务、HR、客服等应用场景," 大模型 " 展现了出色能力。报告预测,各行业都将迅速整合大模型的能力。与其他颠覆型技术一样,这种变革一开始会缓慢发展,然后迅速加速。
国内大模型列表如下
AI 大模型实力哪家强?
为了更好地评估和比较这些模型在中文领網域的表现,已经有针对中文的通用大模型的测评基准。
中文通用大模型基准(SuperCLUE)就是其中的一个测评基准,尝试对主流的 AI 通用模型进行一个可量化的对比评分。它主要回答的问题是:在当前通用大模型大力发展的情况下,中文大模型的效果情况。包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比。SuperCLUE 从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。其中专业能力包括中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等 50 多项能力。
近日,SuperCLUE 发布了大模型 6 月榜单。6 月榜单由 4 部分组成:总排行榜、基础能力榜单、中文特性榜单、70 亿参数量级榜单。
2023 年 6 月 SuperCLUE 中文大模型总排行榜
2023 年 6 月 SuperCLUE 基础能力榜单
2023 年 6 月 SuperCLUE 中文特性榜单
2023 年 6 月 SuperCLUE-70 亿参数量级榜单
从榜单上的测评结果来看,GPT-4 的综合能力和单项能力都表现非常出色,各榜单中 GPT-4 都是独占鳌头,比第二名 GPT-3.5-turbo 要强不少;其次是 GPT-3.5-turbo、Claude,二者评分旗鼓相当。
国内的几个大模型的表现只能说是有待加强,与 GPT4 的差距还是相当明显的,在 AI 大模型的竞赛中,国内模型的追赶步伐还得再快些,按 360 集团创始人周鸿祎话说,目前中国 AI 模型与 GPT-4 之间的差距在 2 到 3 年左右。
大模型时代的 AI 十大趋势
针对大模型 AI 技术发展,腾讯研究院、同济大学、腾讯云、腾讯新闻基于产学研等多方在 AI 领網域的研究,共同发布了《人机共生——大模型时代的 AI 十大趋势观察》报告,从技术、应用、社会等角度,提出大模型时代的关键性趋势观察。
十大趋势分别为:LLM 推动人工智能快速进化到 AGI 阶段,多模态助力大模型解决复杂问题,生成式 AI 带来更贴近人的互動方式,模型即服务(MaaS)生态呼之欲出,垂直领網域应用是大模型的主战场,Plugin 工具让大模型迎来 App Store 时刻,大模型为数字人 " 注入灵魂 ",AI 大模型将帮助个体成为超级生产者,版权 " 思想表达二分法 " 基石正在动摇,伦理和安全建设塑造负责任的 AI 生态。
技术趋势
大语言模型和多模态技术将助力人工智能向 AGI 发展
AGI(通用人工智能)是一种具有所有人类智能能力的机器,它可以理解、学习、适应和实现任何知识工作。报告显示,自 2010 年代初深度学习问世以来,人工智能进入到第三次高潮,而 2017 年出现的 Transformer 算法,又将深度学习推向了大模型时代。以 ChatGPT 为代表的大语言模型,展现出来的推理、思维链等能力,让人类感到惊讶,尤其是 GPT4 在多种能力测试中达到人类顶级水平,更是让人类看到了 AGI 的曙光。
未来真正的 AGI 可以自然地处理多种类型信息,它需要具有高效的多模态信息处理机制。报告认为,多模态 AI 不仅能够处理单一数据类型的任务,而且可以在不同数据类型间建立联系和融合,为解决复杂问题提供支持,因此多模态 AI 也将助力人工智能向 AGI 发展。
报告还强调,多模态 AI 也将带来创新应用的蓝海,例如多模态 AI 可以扩展在社交媒体中的实时语音、文字、影像和视频的处理能力,为传统游戏和增强现实 / 虚拟现实(AR / VR)应用带来更为丰富和沉浸式体验。
应用趋势
AI 将给产品互動、企业生态、商业模式等多个领網域带来变革
在应用层面,报告重点提到了 AI 对产品互動、企业生态、商业模式、个人创作能力等方面的变革。
在产品互動方面,过去人类用键盘滑鼠与电腦互動,用手指触屏与手机互動,用唤醒词与智能音箱互動,但生成式 AI 让人类可以用自然语言的方式跟机器对话,机器也可以通过大模型拥有理解人类语言的能力。报告显示,过去的数次人机互動变革,都带来了从终端到连接,到各类应用的颠覆式变革,生成式 AI 也必将带来产业链、价值链和生态的重塑。
在商业模式方面,大模型促进了 AI 的工业化,并且正在重构现有的商业模式,未来将形成模型即服务的 MaaS 生态。报告显示,未来的数字化商业将分为大模型基础设施型企业、垂直行业领網域的小模型应用企业,以及更加贴合个人用户的模型应用和服务。这一生态的建立和发展,将更广泛地赋能各行业应用,加快社会各领網域数字化转型、智能化发展,带来全社会的生产效率提升。
此外,垂直领網域应用将是大模型的主战场。随着生成式人工智能技术的飞速发展,它已经在多个领網域展现出全新的商业价值。在中国,诸多行业企业也已经看到生成式 AI、大模型可能为企业带来竞争优势。金融行业、文化娱乐行业等头部机构预计会在一年内,在相对成熟的场景中尝试引入大模型以及生成式 AI 能力。
与此同时,MaaS 服务正助力加速行业大模型落地。腾讯云从产业客户需求场景出发,基于大模型高性能计算集群和大模型能力,依托腾讯云 TI 平台打造模型精选商店,为客户提供 MaaS 一站式服务和行业大模型解决方案,全面降低落地门槛,助力客户构建专属大模型及智能应用。截至目前,腾讯云已联合行业头部企业,为 10 大行业输出了超过 50 个解决方案,提供一整套模型服务工具链,帮助企业高效宰、高品质、低成本创建和部署 AI 应用。
对于个人来讲,AI 大模型将助力个体成为超级生产者。报告指出,基于生成式 AI 的新应用快速进化,涌现出许多新型面向个体的生产力应用。在创意制作、文本生成、影像和视频工具、学习工具、阅读工具、市场分析、编程等各个领網域快速融入工作流,从信息处理、个性化学习、辅助创作、智能优化等方面协助人类创作,赋能个体成为超级生产者。在大模型的加持下,人工智能正在从 " 工具 " 变成 " 伙伴 ",人机关系将进入到下一阶段。
社会趋势
重点审视版权归属难题和伦理挑战
在社会观察层面,报告重点关注当下受到 AI 冲击最为明显的两个领網域:版权与治理。
传统的版权制度立足于 " 思想表达二分法 " 这一基本原则,即 " 只保护自然人思想的表达,而不保护自然人的思想本身 "。报告指出,在人工智能时代,版权制度如果无法对 " 人的创造性思想 " 和 "AI 模型的独创性表达 " 加以有效回应,那么其适用价值将会受到极大影响。
同时,生成式 AI 也带来了更加复杂难控的风险,包括对人类未来生存的潜在风险。报告指出,AI 时代需要成为一个负责任创新的时代,人们需要建立合理审慎的 AI 伦理和治理框架,塑造负责任的 AI 生态,打造人机和谐共生的未来。
其中,生成式 AI 领網域的创新主体需要积极探索技术上和管理上的安全保障措施,为生成式 AI 的健康发展和安全可控应用构筑起防护栏。
▐ 风口洞察
▐ 行业报告
▐ 国际要闻
▐ 政策新规
▐ 数据观出品
>