大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

重读AI大模型元年:“百模赶考,文心夺魁”

2024-02-07 简体 HK SG TW

今天小编分享的科学经验:重读AI大模型元年:“百模赶考,文心夺魁”,欢迎阅读。

把时间倒回一年之前,那时很多媒体和网友讨论,中国能做出来类 ChatGPT 的大模型应用吗?

当时我们就说,不用慌,不用忙,中国一定能做成大模型。转瞬间,被称为 " 大模型元年 " 的 2023 年即将在爆竹声中结束。中国 AI 大模型,举头已觉千山绿。

根据相关数据,到 2023 年 10 月中国市场已经发布了超过 230 个大模型。" 百模赶考 " 实至名归。但是,大模型数量并不是做成大模型的终点,甚至不是做大模型的目的。

在今天这个阶段,我们必须回答新的问题:大模型有了,怎么才能把大模型做好,用好?怎么才能让大模型为社会经济做出巨大价值?

想回答这个问题,就必须知道大模型的 " 好 " 是什么。

评价大模型的质量好坏,不是靠参数,靠规模,而是比效率,比技术,比应用,比生态,最终比谁最好用,谁最有用。

在探讨这些问题时,我们会发现国产大模型格局的另一面:大模型虽多,但普通人知道,用到的却并不多。随便找个朋友问一问,会发现他大概率只知道一个国产大模型,那就是文心一言与其背后的文心大模型。

虽然有数量过百的大模型策马奔腾,但却是文心大模型一骑绝尘。为什么会这样?

理解这个问题,才能理解大模型的本质规律:只有厚积薄发,做深做强,才是国产大模型的未来之路。

岁末回首,重新审视 " 百模赶考,文心夺魁 " 的行业格局,能看到 AGI 的曙光正悄然来到这片土地上。

身位之先

大模型的效率竞赛

在 AI 大模型刚刚兴起之际,用户对它有好奇,行业对它有渴望,社会经济对它有广泛多元的期待。这时,谁能够率先将大模型带给用户与产业,谁就能够立下先锋之功,通过身位领先来确定自身的行业优势。

回望过去一年大模型行业的发展,会发现文心大模型每次都在扮演先锋的角色。最终将大模型技术最快交到用户、开发者以及千行百业手中。文心大模型的高效率、快节奏,以及这背后的技术领先与产品自信,是其能够保持 " 一骑绝尘 " 的首要关键。

2023 年 3 月,百度率先发布了文心一言大语言模型。这得益于百度十余年布局和深耕深度学习技术,并进行了广泛的 AI 业务实践。从 2019 年开始,百度就深耕预模型研发,打造了文心大模型体系。厚积薄发,做足准备的文心,在开年之际就达成了一路领先。

2023 年 7 月,在 2023 世界人工智能大会期间,国家人工智能标准化总体组宣布了中国首个大模型标准化专题组组长部門名单,百度担任联合组长部門。至此,文心大模型正式进入 " 大模型国家队 ",为国产大模型标准化事业探寻航道,确立方向。

接下来,在 8 月 31 日,文心一言正式面向全社会开放,成为中国公众能够最早体验到的大语言模型,真正将大模型能力带到千家万户,寻常巷陌。

2013 年 12 月,中国首个官方 " 大模型标准符合性评测 " 结果出炉。文心一言成为首批通过评测,符合《人工智能大规模预训练模型 第 2 部分:评测指标与方法》语言大模型的相关技术要求,通用性、智能性等维度全面达到国家相关标准。

最先推出,最新开放,最先符合国家标准," 先 " 已经成为文心大模型的关键词。深耕 AI 核心技术,打造 AI 生态,带来的是厚积薄发下的高效率与快节奏。

文心之先,一骑绝尘,可以为整个 AI 行业所借鉴。

技术做厚

大模型的技术差异化积累

在我们讨论 AI 大模型数量过多,行业饱和的问题时,经常会注意到一个现象:数百个大模型问世,但我们却很难找到这些大模型之间的技术差异化有哪些?更遑论体会到技术差异带来了应用差异。

这个现象出现的原因,在于大模型盲目追求数据量与模型参数,忽视了核心技术的研发与积累。文心大模型之所以反响好,用户认同高,就在于它选择了最厚重,最扎实的技术研发之路。每一代文心大模型更新,都建立在新技术能力的研发与运用基础上。这就导致文心越更新,与其他大模型的技术能力差距就越大。技术的滚雪球现象开始显现,最终形成了文心大模型在技术方面 " 人无我有,人有我优 " 的战略优势。堆山百仞,起于垒土。

2023 年发布的文心一言背后,是文心大模型 3.0。当时文心已经凭借知识增强技术确立了大模型领網域的技术差异化,具备知识增强、检索增强和对话增强的优势。

随后到 5 月,文心大模型 3.5 版本发布。其在基础模型、精调技术、知识点增强、逻辑推理、插件机制等方面进行了创新,取得了生成效果和效率的全面提升。

到了 10 月,文心大模型 4.0 版本正式推出。其在多个关键技术方向上实现了突破,在理解、生成、逻辑、记忆四大能力上都有显著提升。尤其逻辑和记忆能力大幅提升,带给用户非常直观的帮助。

文心大模型能够实现如此高效率、大幅度的技术更新,离不开其背后高效算力、自研框架,以及数据处理机制的协同优化。尤其文心飞桨联合调优,成为业界著名的大模型高速发展案例,在过去一年受到了 AI 行业的广泛讨论。

文心大模型在万卡算力上基于飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。自 2023 年 3 月发布以来,文心大模型的训练效率已提升数倍,周均训练有效率已经超过 98%。

对核心技术的探索,对技术差异化的积累,让文心大模型有了技术之厚。这是文心持续领先的底牌与底色。只要在技术上有更高追求,很多问题就自然会有答案。

应用需广

如何将大模型带到应用一线?

想要知道一棵树是不是栋梁之材,不能仅仅坐而论道,把它夸得天花乱坠,而是要把它真正用起来,让它去架梁持屋,发挥自己的价值。

对于 AI 大模型来说也是如此。大模型是否有用,不是在发布会和测试数据里说出来的,而是在亿万用户,在千行百业手里用出来的。

审视过往一年的大模型行业发展,我们会发现在应用的广度上,文心是其他大模型难以望其项背的。在 C 端用户,只有文心一言实现了亿级用户规模;在 B 端应用,文心大模型的调用量超过了其他 200 家大模型的总和。

跨越数量级的应用领先,让文心大模型在行业用户、开发者、普通用户手中探索出了无数种价值可能。在百度业务当中,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品;在对外开放过程中,文心大模型通过飞桨开源开放平台、百度智能云赋能制造、能源、金融、通信、媒体、城市、教育等各行各业。文心大模型已与各行业头部企业、机构共建了超过 10 个行业大模型,加速行业智能化更新。

在国家跳水队,文心大模型对 AI 辅助训练系统进行了全面更新,不仅能够理解和执行教练与运动员的复杂指令,还可以对动作实时打分、精准量化分析。2023 年,中国游泳协会授予百度 " 中国国家跳水队人工智能合作伙伴 " 称号。

在与国家图书馆的合作中,文心大模型通过大量学习古代方志和家谱数据,并进行文字识别和理解,打造了 " 古文今问 " 服务。用户只需输入寻根信息,就能得到相应的线索反馈,帮助全球华人寻根访祖。

在声桥 AI 语训团队手中,基于飞桨和文心大模型打造的 AI 口语康复应用,可以提供文字形式的反馈指导,帮助听障人士进行语言训练。

桃李不言,下自成蹊。文心的应用之广,是其价值最好的证明。同时也证明了中国的 AI 大模型并不只有数量,更有应用的质量,有真材实料的智能化探索。

生态需盛

大模型生态建设刻不容缓

我们都知道,做軟體最难的就是做生态。生态决定了基础軟體技术的探索上限,也决定了其未来长期发展的可能性。在 AI 技术刚刚发展起来时,做 AI 必须做生态就成为产业共识。

但在目前阶段,我们可以看到中国有数量过百的大模型,却很少有厂商关注生态建设。长此以往,容易导致大模型变成没人会用,也没人想用的 " 孤品 "。

文心大模型之所以能保持领先,很大一部分原因来自生态的支持与推动。只有千万人共建、共创的大模型,才是有生命力和持久力的大模型。

为此,百度推进飞桨与文心生态共同创新、相互促进。截止 2023 年 12 月,飞桨已凝聚 1070 万开发者,服务 23.5 万家企事业部門,基于飞桨创建了 86 万个模型。飞桨生态与文心生态互为助力,推动彼此高速发展。

开发者社区是生态发展的关键支撑,百度打造了中国最大 AI 社区 " 星河社区 ",伴随大模型的发展,百度正式推出星河大模型社区,为开发者提供一体化大模型开发体验,以及丰富的产品功能。截至 2023 年 12 月,星河大模型社区已经推出了超过 4000 个基于文心大模型的创新 AI 应用。

在生态共创方面,百度发布了文心大模型星河共创计划,希望与开发者和生态伙伴合作,实现 AI 应用的广泛创新。

与开发者生态的相辅相成的,是人才生态的建设。2020 年,百度提出 "5 年为全社会培养 500 万人工智能人才 " 的目标。截至 2023 年 10 月,百度已经培养了 420 万 AI 人才。面对大模型技术巨大的人才需求,2023 年百度发布了全新的人才培养星河计划,将与产学研各界合作,为社会再培养 500 万大模型人才。

无论从开发者聚合、应用创新、人才培养等任何维度来看,文心大模型的生态建设都已经展现出了繁盛的一面。生态起步快,活力高,閱聽人广,真正实现文心大模型的土壤上 " 千树万树梨花开 "。

可以说,文心生态的兴起,为国产大模型生态的整体建设奠定了典范,拓宽了边界。

从大模型元年

到 AGI 曙光

经过风起云涌的一年,大模型领網域的问题,从 " 有没有大模型 ",变成了 " 能不能做好大模型 "" 能不能用好大模型 "。

面对新问题,新考验,文心大模型在身位、技术、应用、生态四个方面的领先就是答案。

根据 IDC《AI 大模型技术能力评估报告,2023》显示,文心大模型在 14 个参评模型中拿下 12 项指标的 7 个满分,综合评分位列国内主流大模型第一,并在算法模型、行业覆盖两大关键指标上拿下唯一满分。

在人民数据发布的《AI 大模型综合能力测评报告》中显示,文心一言不仅综合评分超越 ChatGPT,位居全球第一,更在内容生态、数据认知、知识问答三大维度评分超越 ChatGPT。并且六大维度评分均位列国内大模型榜首。

如果说,在大模型元年,我们看到的是大模型的数量。

那么在更远的未来,在我们所期待的大模型之春,需要看到的是大模型的应用质量和普惠价值。

如何才能实现这个进化?文心大模型已经在过去一年,用 " 先 "" 厚 "" 广 "" 盛 " 这四个字做出了回答。只有整个行业都以这样的路径发展,去芜存菁,避虚务实,国产大模型才能持续向好,打开行业之春,走向 AGI 之夏。

2023 年 8 月 16 日,WAVE SUMMIT 深度学习开发者大会 2023 在北京举行。期间,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为通用人工智能带来曙光。

在这场人类科技面向星辰大海的航行中,我们已经见到了曙光,只有找到正确的方向,选择技术长跑,选择生态共赢,才能让漫长的征程一步步落地,让 AGI 的曙光点点化为现实。

" 百模赶考,文心夺魁 " 的行业格局,本质上是对技术主义与务实精神的肯定。

理解了这一点,也就找到了 AI 技术发展的前路。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們