今天小编分享的科学经验:Scaling law信仰下,新华三网络“越过山丘”,欢迎阅读。
如果大模型有信仰,那一定是 "Scaling Laws(规模法则)"。
所谓 "Scaling Laws",就是模型性能会随着参数、算力、数据集的规模增加而提高。时间来到 2024 年,大模型领網域依旧是 "Scaling Laws" 的统治区。
人工智能时代爆炸式的数据增长,传统 " 马拉肩扛 " 的传输方式,存在易损坏、丢失的风险,也无法支持实时数据更新和互動,会直接影响到中国 AI 产业的先进性。对于攀爬 Scaling law 的中国 AI 产业来说,传统网络已经捉襟见肘,必须全面更新和重塑,更有效地支持大模型时代的联接需求。
近日,紫光股份旗下新华三集团以 " × AI"(乘 AI)为主题举办 2024 媒体与分析师沟通会,全新更新智算版数字大腦,并以全栈领先的灵犀智算解决方案,充分发挥新华三在算力和联接领網域的核心优势,激发 " 算力 × 联接 " 的乘数效应,让算力更快、更强、更澎湃。
理念听起来很美好,具体怎么落地呢?网络如何给算力做乘法?会后,腦极体采访了新华三集团高级副总裁、网络产品线总裁曾富贵,就承载灵犀大模型落地的新华三 AD-NET 7.0,及数据中心、园区、广網域三大场景的相关技术、产品与解决方案,展开了深度交流。在 AI 产业攀爬 Scaling law 的当下,我们不妨来看看,新华三双 A 驱动的网络,是如何带攀登者们越过山丘的。
新华三集团高级副总裁、网络产品线总裁 曾富贵
眺望 Scaling Laws 山峰
那是网络更新的方向
数字化、智能化更新先升网,已经是一个常识。问题在于,究竟什么是网络的更新方向?
对此,曾富贵说过,网络的先进性是技术问题,但是先进网络的具体形态是用户选择的问题。
面向智算时代,AI 产业化和产业 AI 化所需要的网络形态,已经被 "Scaling Laws" 法则所规定。
万亿参数,传输 " 费时 "。大模型的参数量巨大,需要传输大量的数据,传统网络无法满足高带宽需求,需要接入带宽高达 400G 甚至达到 800G 的超大容量网络。
万卡集群,训练 " 费力 "。AI 大模型并行计算模式,催生了新的大规模网络架构,从千卡到万卡集群,未来更新的 GPT 模型可能需要十万卡、几十万卡支撑起来。而 AI 计算集群规模越大,通信量和复杂度越大,网络设备的规模、端口数、光模块的数量指数上升,传统网络面临越来越明显的传输效率瓶颈,一次通信延误,会拖慢整个训练过程,导致整体计算集群效能低下、成本高昂。
万里部署,使用 " 费心 "。算力的分布式部署,全国一体化算网可以减少训练推理成本,解决算力紧缺、算力贵的问题。但跨东西部的算力流动与调度,会受限于 " 联接瓶颈 ",抖动、时延、较长的通信时间,都会让用户身心俱疲,宁可用硬碟坐高铁送。
总而言之,在 AI 大模型场景和应用中,让模型供应商、算力服务商、应用开发者及用户不头疼,轻松翻越 "Scaling Laws" 的网络,就是先进网络。帮助产业攀爬 Scaling Laws,新华三全新更新的 AD-NET 7.0,由 Application+AI 双 A 驱动,如同一双 " 风火轮 ",为 AI 大模型向前发展注入澎湃动力,成为一双智算时代的 " 鞋履 "。
攀登者之力
双 A 驱动网络释放澎湃算力
神话故事中,哪吒踩着一双 " 风火轮 ",获得了高速移动、自由驰骋的能力,极大地提高了战斗效率。对于攀爬 Scaling Laws 的 AI 产业者来说,新华三双 A 驱动的网络,正是一双能够释放澎湃算力的加速 " 战靴 "。
全新更新的 AD-NET 7.0,全面更新网络联接能力,构筑行业智能底座,从三个方面,为智算时代提供有力支撑:
1. 以网强算
AD-NET 7.0 提供的网络基础设施,为 AI 模型的训练提供高效算力支持,为各种智能化服务提供按需的联接服务保障。曾富贵强调,AI 赋能的网络,对数据中心,要充分释放大规模算力集群的潜力,让算力增效;对园区,要让最终客户能够随时随地接入算力,方便使用算力,满足各类业务对算力的智快至简体验需求;对广網域网,要通过算力网络不同规模、不同行业客户都能享受算力建设带来的数字红利,实现业务智享的普惠型算力资源供给。
2. 以算提智
新华三端到端智算能力,不仅解决了 " 算力焦渴 ",还进一步结合过去 21 年积累的 ICT 运维领網域知识和大量语料,融合打造出更懂行业运维需求的 AI 私網域大模型——灵犀大模型。基于新华三在 ICT 领網域的知识语料积累和上万名网络专家的专业经验,利用充足的算力训练和微调得到灵犀大模型,通过内置灵犀大模型更新 AD-NET 解决方案。
3. 以智增效
算力网络变得复杂,靠人的普通管理是不行的,一定需要更强大、更高效的 AI 技术为网络提供 " 导航 "。为了提升网络的智能化水平,AD-NET 7.0 搭载了灵犀大模型,可以利用 AI 强大的创造力和互動能力,提升网络管理效率。
曾富贵直言,很多东西说起来很容易,实现起来很难。我们希望通过灵犀大模型,加上硬體原生智能,让整个网络更高效。这个覆盖面很大,目前我们在某些场景做了一些尝试,取得突破。目前,新华三已经探索出了大模型在数据通信领網域落地的几个典型场景。
AI 可视:网络设备与平台协同计算,对设备日志、流量模型应用等多维信息进行 AI 分析,实现贯穿应用和网络基础设施的信息洞察。
AI 调优:基于用户业务提供最优配置建议,持续学习网络状态,提供自进化的有线无线网络调优功能,体验识别准确度达 92%。
AI 排障:基于海量网络设备数据训练结果,实现链路级、设备级、网络级到应用级快速排障,覆盖 90% 以上的网络。
AI 安全:网安联动,持续学习用户网络行为,精准标识可疑用户及可疑行为,实现动态安全防护。
以应用为牵引,以 AI 为抓手," 双 A 驱动 " 的新华三网络和 AD-NET 7.0,成为千行百业加速智能化的一双 " 战靴 ",提供澎湃的算力和动能。
越过山丘
从新华三网络看见
智能中国的少年心气
数字化、智能化是中国乃至全球经济发展的重要趋势,也是摆在中国社会面前的一道新题目。征服 Scaling Laws 的高峰,夯实智能中国的基础,是一项庞大的系统工程,众多 ICT 相关企业都参与其中。
作为数字化解决方案领导者,新华三躬身入局智能新时代,激活了一种勇往直前的少年气。双 A 驱动的网络更新,就是这种气质的具象体现。
少年气,就是天命在我,敢于担起时代责任。
曾富贵提到,Application + Al Driven,既是趋势也是使命。我们希望,新华三的网络能够为后续算力的普惠化提供坚实的基础,这既是新华三的技术趋势,也是网络的使命。
少年气,就是学习能力强,始终没有停下进步的脚步。
曾经,新华三网络以应用(Application)为中心单轮驱动,在 AI 时代他们进行了重新的赋能、更新和诠释。经由灵犀大模型的全面融合,新华三网络拥有了全面智慧。
少年气,就是怀抱理想,为护佑苍生长出三头六臂。
以对 AI 训练最为关键的智算中心为例,AD-NET 7.0 引入了多种负载均衡技术。针对不同智算场景,提供最适合的负载均衡技术组合,让每条链路都充分得到利用,提升智算中心算力规模和效率。
曾富贵介绍到,负载均衡之所以如此重要,是充分理解到传统计算模型与智算的计算模型有巨大的差异, 智算中心的流量不同于互联网流量,其存在单流流量大、整体流数量少、大量突发等特点,唯有通过智能化地负载均衡技术,将数据流量合理分散到不同链路上,才能保证无阻塞、不丢包,使智算中心得以顺利完成计算需求。
此外,新华三通过多元的产品形态,支撑 AI 时代的网络迭代。比如面向数据中心,提供了专为 AI 而生的 S12500 AI 系列产品,为 AI 模型的训练提供高效算力联接支持。面向广網域网,更新 400G 端口能力、将算力因子纳入路由计算算法,提供服务化算力专线等,实现广網域算力传送的全面优化。面向园区,全光 +Wi-Fi 7,为基于 AI 的各种场景智慧化应用提供了最后一跳的高质量接入体验。
和新华三一样,中国 AI 产业及千行万企,也都勇敢踏上了智能时代的创新旅程。纵然攀爬 Scaling Laws 充满艰难,但越过山丘后的智能中国,也格外让人心驰神往。
对智能攀登者来说,新华三双 A 驱动的网络,是承载数据要素的路,是加速释放算力价值的 " 风火轮 ",也是一同走过山高水远的同路人。
越过山丘的智能中国,恰似少年游。