今天小编分享的科学经验:1天训完45亿参数大模型!高校计算能力首次比肩科技巨头,欢迎阅读。
" 第一次,高校拥有了和科技巨头一样的计算能力。"
说这句话的人是中国工程院院士、阿里云创始人王坚。
他口中让高校计算能力倍增的,是复旦大学刚刚发布的云上科研智算平台。
名为CFFF(Computing for the Future at Fudan),由复旦、阿里云、中国电信等共同打造,以公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练。
这是目前国内高校最大的云上科研智算平台—— 67 年前,我国第一架电子计算机(复旦 601 型电子积分机,1956 年)诞生在复旦;67 年后,复旦再次走在前列。
目前,首个基于 CFFF 平台训练的科学大模型成果已经对外正式发布,45 亿参数的中短期天气预报大模型可一日训完。
组成 CFFF 平台的两个计算集群,一个名为 " 近思 " 一号,一个名为 " 切问 " 一号。
两个名字都从复旦校训 " 博学而笃志,切问而近思 " 中采撷而来。
发布会上,首届世界科学智能大赛也正式启动,設定 5 大前沿研究赛道,赛题基于 CFFF 平台而来,目的是推动科学大模型落地。
CFFF 是什么?
CFFF 平台,全称 Computing for the Future at Fudan。
这个名字被王坚解读为 " 计算,因为在复旦而创造了未来 "。
两个计算集群共同组成了 CFFF 平台——
一个是面向高精尖研究的专用高性能计算集群" 近思 " 一号,部署部署在复旦江湾校区;
另一个是面向多学科融合创新的 AI for Science 智能计算集群" 切问 " 一号,托管在 1500 公里外的内蒙古阿里云乌兰察布数据中心。
两者分隔千里,但同声相应。
复旦大学浩清教授、人工智能创新与产业研究院院长漆远对 CFFF 平台做了进一步介绍。
据他讲述,基于百 G 高速数据传输网、阿里云大规模异构算力融合调度技术、分级存储技术、AI 与大数据一体化技术,两个计算集群练成了一台真正意义上的 " 超级计算机 "。
何以见得?
最直观的表现,复旦大学四校区的所有实验设备都能高速接入 CFFF 平台,做到异构算力统一管理,计算任务统一调度,满足不同应用场景下的科学智能研究与应用需求。
此外,CFFF 平台还拥有国内高校最大规模的多级数据冷热分层存储集群,解决了海量科研数据无法长期备份的痛点,并支持云上高速传输。
举个例子,以往 PB 级科研数据从复旦校内传到西部数据中心需要两周,如今当天就能完成。
有赖于公共云模式,跑在 CFFF 平台上的项目可享受到超千卡并行的智能算力,千卡并行的有效算力达到行业领先的 92%,可拓展性达到万卡,万卡并行有效算力也可达 90%。
同时,CFFF 平台可实现年平均 PUE 小于 1.2,每年节省总电力超过 2000 兆瓦时,年均节碳量达 1500 吨。
可以说是非常低碳了。
复旦校方透露道,CFFF 平台从开始建设的第一天起,就收到来自复旦不同院系的多种研究需求,如生命科学、大气科学、材料科学领網域,以及金融系统分析等社会科学研究领網域。
平台上的云原生与低代码工程化 AI 开发平台,进一步降低了 AI 与科研融合的门槛。
目前,CFFF 平台上的第一个科研成果已经诞生,并正式对外发布。
成果是45 亿参数量的中短期天气预报大模型,来自复旦人工智能创新与产业研究院李昊团队。
在公开数据集上,该模型预测效果首次达到业界公认的 ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了 3 秒内。
而这样一个 45 亿参数的大模型,在 CFFF 平台上完成训练,用时只需 1 天。
中国科学院院士、复旦大学校长金力在现场提到:
CFFF 设计成了开放的体系,我们非常欢迎产学研创新以及校企合作。但是从另一点来说,CFFF 的建立表面上来看是解决算力问题,实际上不完全是。
它还必须解决两件事情,一是" 让原来不会用 AI 工具的人,去用最好的 AI 工具 ",二是" 让原来不懂 AI 的人去懂 AI"。
7 名院士担任顾问,大赛 7 月 25 日开赛
" 当前,AIforScience 成为热点领網域。" 金力将 CFFF 称为复旦推动基础研究范式变革中的关键利器,"AI 与科学的融合发展,开拓了科研的新范式。"
CFFF 平台启动仪式现场,首届世界科学智能大赛也宣布启动。
从现场获悉,大赛由复旦联合阿里云天池平台、中国电信、中国信通院云大所等举办。
面向全球开放,拟邀请全球五大洲数千支队伍参赛,选手不限国籍年龄,高校、科研机构、企业、个人均可自由组队。
包括金力(生命科学家)、王坚(云计算专家)在内,共有 7 名院士担任本次大赛的顾问。
共設定 5 大赛道,分别是生命科学、大气科学、材料科学、流体力学、量子化学,赛题基于 CFFF 平台设计。
其中,生命科学赛道,以生物学年龄评价与老年病风险预测为赛题,通过测量和分析生物体内特定指标或生理过程的状态,评估个体的生理年龄和健康状况。
大赛为参赛者开放了近万样本的个体甲基化数据以及其年龄、性别及老年病患病信息,期望参赛者能够基于甲基化测量对健康个体的年龄给出准确的预测。
而材料科学赛道,以 MOF 材料的预测合成为切入点,探求计算成本更低、更高效、更精确的求解方法。
大赛整理了大量文献等,形成了 1500 种 MOF 材料的合成条件数据集,期待参赛选手基于此建立预测模型,准确地预测 MOF 材料的合成条件。
赛程显示,7 月 25 日大赛初赛开启,9 月底,各赛道分批开启复赛。
遴选出的优秀队伍将在 11 月进行线下答辩,角逐最终名次。
大赛設定 100 万元的奖金池,各赛道冠军奖金 10 万元。
所有进入复赛的选手都将获得 CFFF 平台算力免费支持。此外,阿里云也将提供了 ML 平台 PAI 的免费试用,及算力产品计算资源。
大赛网站:
https://tianchi.aliyun.com/2023CFFFPrize