今天小编分享的科技经验:高校,一觉醒来成了智算采购大户,欢迎阅读。
大模型正在改变高校的什么?
文|周享玥
编|赵艳秋
过去两年,以大模型为代表的新一代人工智能浪潮,在全球的发展中展现出蓬勃活力和巨大潜力。AI 已不仅仅是技术进步的象征,更已成为国家战略中的核心要素。
" 如果说今天有什么事是我们一定要做的,那就是 AI For Science(AI4S)。难以想象今天还有什么事情比它更重要,今年诺贝尔奖的颁布便是最好证明。"
11 月下旬,在深圳举办的 2024 年 IDEA 大会上,香港科技大学校董会主席沈向洋表示,当前做人工智能研究,一方面要全力推动大模型技术的落地,另一方面也要关注它在科学研究中的应用。
第二天,在前往香港与黄仁勋进行一场对谈的过程中,沈向洋又再次提到了 AI for Science,并提及香港科技大学已围绕这一热门方向,投入大量的计算基础设施和 GPU 资源。
黄仁勋则回应称,高校目前确实面临着一个严峻的结构性难题,即计算资源分散,反而导致一些研究算力获取难。这也是为什么,之前很多研究员选择先前往英伟达、谷歌、微软等大公司进行研究,再返回大学,甚至许多教授,会选择在从事教学工作的同时,兼顾研究工作的原因。
黄仁勋因此建议 " 大学应该成为基础设施建设的引领者,通过集中资源来推动全校的研究发展 "。
实际上,业界观察,最近两年随着大模型的到来,尤其近期诺贝尔奖的发布,让高校对 AI for Science、大模型和智算的投入热情进一步高涨。
01
诺贝尔奖后,高校热情高涨
最近,多位业界人士观察,围绕 AI for Science,高校对大模型、算力等方面的需求正在愈发活跃。
大模型方面,最近两个月,教育依然是公开招投标市场上,出单数排名前列的几大行业之一。" 现在不光是 211、985,还有大量地方级的一本、二本学校也都在主动联系我们,探讨合作。" 一位大模型行业人士告诉," 高校都在努力拥抱大模型。"
算力方面,近期市场上,更是频繁涌现大单,多所大学都在发布千万元级别甚至上亿元的算力采购需求。
AI for Science 并不是一个新概念,早在 2018 年,中科院院士鄂维南就在全球首次提出 "AI for Science(科学智能)" 概念。AlphaFold 在蛋白质结构预测方面的重大突破,也持续推动着这一概念深入大众视野。而今年 10 月,诺贝尔物理学奖、化学奖纷纷颁给人工智能相关专家,则让这一概念走向更大舞台,再一次成为了热门话题。
" 大家最兴奋的是,原来 AI for Science 要由各种不同的模型去做,但现在搞蛋白质的、搞数学的 ...... 都可以‘揉’到大模型的方式中来,核心架构甚至全都是 transformer。" 百度杰出系统架构师王雁鹏告诉数智前线。
这让一向作为科研主阵地的高校们看到了新的确定性方向,都在集中火力,推进 AI for Science 的发展。
更频繁的学术交流和经验探讨是一方面。近期,全国各地涌现出了多场 AI for Science 相关论坛。其中,有不少是由高校主动发起。比如,10 月底的 2024 中国计算机大会上,复旦大学发起和组织了 " 第一届科学智能(AI for Science)论坛——探索科学智能的边界 "。11 月初,北京大学计算机学院,也和北京科学智能研究院一起,主办了 "2024 科学智能峰会 " ……
一些高校也在成立专门的机构或组织,来推进 AI for Science 发展。比如香港城市大学,就在 10 月 21 日宣布成立了香港人工智能与科学研究院,并与多名学术和业界伙伴签署合作备忘录,共同推进人工智能(AI)领網域的前沿科研。
人才方面的培养也在加速。数智前线注意到,10 月底至今,浙江大学已经与中国人工智能学会(CAAI)、国家开放大学、CAAI 教育工作委员会等一起,连续制作六期 " 诺奖后谈 AI" 的人工智能通识课程系列直播公开课,推动大学生人工智能素养培养。
除此之外,大模型时代下的 AI for Science,正在对高校的算力问题提出新的要求。
业界观察,高校传统的算力建设方式,往往是不同院系甚至不同研究小组,自行采购和管理各自的计算资源,从而导致一个学校内存在多个小型计算集群,容易出现算力资源分散管理、忙闲不均、共享不畅等问题,无法满足大型模型研发所需的高速通讯要求,拖慢科研成果产出效率。
" 为适应 AI4S 的需求,模型研发必须在算力、算法和模型框架等多个方面进行协同优化和建设,传统的分散建设方式已不再适用。" 去年 10 月,在一场 AI 大会上,复旦大学人工智能创新与产业研究院研究员程远曾表示。
为此,早在去年 6 月,复旦大学就和阿里云、中国电信合作打造上线了号称是当时 " 中国高校规模最大的云上科研智能计算平台 CFFF"。而该平台由面向多学科融合创新的 AI for Science 计算集群 " 切问 1 号 " 和面向计算科学高精尖研究的专用高性能计算集群 " 近思 1 号 " 两部分组成。
无独有偶,更多高校也都在加速算力基础设施的投入和建设。今年 1 月,浙江大学与中国移动签署战略合作協定,并宣布共同打造 " 全国首个校企合营模式算力中心——中国移动 - 浙江大学启真算力中心 "。4 月,香港科技大学(广州)智算中心也正式启用……
今年 10 月,诺贝尔奖的发布,则带来了进一步的需求刺激。" 最近,高校的热情普遍很高,预算也在变多。" 王雁鹏告诉数智前线,他们已经看到好几个高校,都拿到几亿元的资金,要加大智算基础设施的投入。
像上海交通大学,已转变传统科研模式,期望科学与 AI 更紧密的结合。他们与百度智能云合作建成了自己的 AI for Science 科学数据开源开放平台,支撑白玉兰科学大模型的训练。依托 AI for Science 平台,上海交大已在 Nature Computational Science 封面,发表了 AI+ 城市的科学成果。
02
大模型时代,产学研合作有了新内涵
高校纷纷加码 AI for Science 的同时,产学研的结合正变得愈加密切。
中国科学院院士鄂维南曾不止一次在演讲中表示,随着 AI for Science 的发展,科学研究将告别原来一个课题组完成所有科研任务相关事务的 " 作坊模式 ",转为类似 " 安卓模式 " 的平台科研,打破学科边界。
" 在平台科研的基础上,针对具体的应用场景,通过垂直整合方式组织科学团队、实验团队、产业界专家联合进行突破瓶頸,将极大提升科研的效率以及产业发展。" 鄂维南说。
一位来自国内大模型和算力服务企业的资深人士也告诉数智前线,随着大模型的到来和持续落地,校企合作目前已成为普遍趋势。" 原来很多东西都是我们要主动去找高校,但最近两年,高校主动找来的比较多。" 该人士表示。
合作也在更加深化。" 原来可能只是和高校本身签一个战略協定,在 IaaS 层合作,或者大家去找到一个点,做一些传统应用的合作。" 上述人士介绍,但最近两年,高校里面的很多二级学院,也都在纷纷找他们进行合作。而这些二级学院,想要合作的业务方向也都不一样,往往覆盖了交通、药品、能源制造等不同领網域,毕竟他们手中握有一些专业数据,在大模型时代有必要条件。
不过,AI 虽然帮助突破了原来的科研瓶颈,但对科研团队的 " 硬 + 软 " 实力也提出了更高要求,校企合作更有利于实现优势互补。
比如在隧道与地下施工领網域,山东大学与浪潮云合作,通过地质统计学、流体力学、计算机科学及信息科学等多个学科联合,搭建了岩土工程领網域大模型与灾害预控数字孪生平台,探索形成地下工程灾害由被动处治到主动、科学、智能防控转变的关键技术。
而浪潮信息自 2020 年以来,持续参与了西湖大学算力平台的建设,在这家建设初衷是将创新从零到一做起的学校,加速其在药物科研等方面的探索。
复旦大学,则在与阿里云、中国电信联手打造 CFFF 平台一年后,已有超 300 个科研团队在这该平台上开展研究,且几乎都是跨学科团队。一批垂直领網域大模型也在此诞生和活跃,如国内首个多模态的对话式大语言模型—— MOSS 大语言模型;结合 3D 分子构象,预测药物物理化学属性的 ADMET 预测模型;研究长序列、细粒度的基因调控关系的女娲 DNA 大模型等。
值得一提的是,企业助力高校实现 AI for Science 的同时,高校们产出的科研成果,实际上也在反过来服务企业的客户,实现某种意义上的 Science for AI。
" 比如,我们和某大学合作打造行业大模型的过程中,他们有研究几十年的学术数据,我们有大模型和算力,通过合作,他们加速了科研成果的转化,这些研发出来的产品,目前也正在面向我们的其他客户,进行试点推广。" 一位行业人士表示。
某大学与百度云合作,将某制造行业的一些需求用大模型跑通后,也能嫁接到百度的模型上来,去大范围服务客户。
也因此,业界观察,目前不管是高校还是企业,都对 AI 领網域的产学研合作抱以厚望。
最近的高校招标项目中,就有不少项目都与 " 产教融合 " 有关。比如上海交通大学的 " 面向产教融合的可扩展异构协同智算平台 " 项目,哈尔滨工业大学的 " 人工智能产教融合创新平台总集 " 项目。
而在更早之前,复旦大学 CFFF 平台正式上线时,中国工程院院士、阿里云创始人王坚更是一度表示,复旦大学和阿里云的合作是产学研协同的创新," 甚至可以像当年 MIT 跟贝尔实验室合作使得今天的大学工学院有了通信专业一样,以产学研的合作创造出一个新领網域、一个新机会。"
03
一些经验正在形成
"AI for Science 在材料、生命科学、能源化工等领網域落地成果的不断涌现,让我们看到其带来的巨大前景。但 AI for Science 带来的不仅仅是点状的突破,而是系统性地带动科学研究基础设施的建设,推进迈向‘平台科研’时代。"2024 年 7 月,在 2024 世界人工智能大会的一场分论坛上,中国科学院院士鄂维南如是称。
他同时强调,发展 AI for Science,落地 " 平台科研 " 模式,应该着重推进 " 四梁 N 柱 " 方面的综合建设和发展。
其中," 四梁 ",即指新一代科学研究的基础设施,包括基本原理与数据驱动的算法模型与軟體、高精度高效率的实验表征方法、替代文献的数据库与知识库,以及高度整合的算力平台。具体科学及产业问题,如新能源汽车、生命科学、能源材料等,则构成所谓的 "N 柱 "。
在这种大背景下,最近两年,高校和企业都在纷纷加速推动 AI for Science 的基础设施建设。而在这个过程中,一些经验也在相互合作中逐渐积累。
比如在大模型方面,一位大厂人士告诉数智前线,高校在选择合作伙伴时,往往最为看中三方面的因素:公司体量是否够大,能弥补他们资源上的优势;算力和大模型技术方面的优势是否突出;服务能力是否可持续,而不是一杆子买卖。而企业则看中高校科研团队里是否有资深的人才,更优质的行业数据等。
在科研计算平台建设方面,复旦大学研究员程远则在去年 10 月的一场大会上,分享了复旦大学的三大关键建设思路。
其一,要提高集群计算的加速。尤其是在模型训练相关领網域,不仅要增加硬體算力,还需在并行训练框架层面进行优化。
其二,将 AI 和 HPC 计算融合,以满足不同科研计算需求。
其三,研发易于使用的 AI4S 工具,以满足科学家对于 AI 易用性的需求。
随着今年合作的深入,效率、稳定性、节能等是这波热潮中,高校对算力基础设施的基本要求。
围绕这些需求,AI for Science 基础设施产业链上的一众企业也在快速行动,推出对应的产品和服务。尤其是百度云、阿里云、腾讯云、华为云等多家云厂商,都在这块儿有不少探索。
百度继上海交通大学后,在今年 1 月,与另一家 985 重点高校重庆大学签署战略合作協定,双方将共建 " 重庆大学 - 百度智能云联合创新中心 ", 聚焦山地自动驾驶、大模型应用、信息安全等前沿关键领網域,联合开展高水平科技创新,共同打造 AI For Science 科研计算平台。
华为则依托智能感知、智能联接、智能中枢等全栈自主创新产品和平台,构建起实验室科研园区、科研服务、科研计算三大科研平台能力,推出了智算实验室解决方案,向外提供。
腾讯据悉也面向 AI for Science 浪潮,推出了 " 弹性服务、开箱即用 " 科研生态云。
中国移动,在今年 10 月,发布了 AI 赋能科学 "AI For Science(AI4S)科学装置智算节点 ",并提供 AI4S Station 科学工作站平台。该工作站集合了科研模型研发基础工具集、科学模型服务平台、生物蛋白等科学领網域工具套件,提供端到端极简科研开发流程,让科学家专注自身专业领網域,提升科研模型研发效率。
一些创业公司也同样瞄准在了 AI4S 领網域的基础设施搭建。比如深势科技,正在为有基础科研需求的产业和企业提供 AI4S 研究工具和平台。
AI for Science 热潮下,高校和企业还在持续不断动作中……
© 本文为数智前线(szqx1991)原创内容
进群、转载或商务合作联系后台
文章精选
>