February 1, 2024

欧盟基于ARM推出首台ExaFLOP超级计算机,x86出局

欧洲首台百亿亿次超级计算机Jupiter配置已经完成,这对Nvidia来说是一个胜利,对x86芯片供应商英特尔和AMD来说却是个失利。Jupiter超级计算机结合基于ARM架构的SiPearl Rhea处理器与Nvidia的加速器技术,将耗资2.73亿欧元建造。

这台超级计算机是由欧洲高性能计算联合项目(EuroHPC JU)和包括Eviden、ParTec在内的一个财团建造的。Eviden是Atos旗下专注于高性能计算(HPC)和人工智能(AI)等高级计算项目的业务。

位于Aachen附近的Jülich超级计算中心将托管该系统,安装工作将于2024年初开始。具体来说,超级计算机的主计算集群将基于ARM CPU,初始配置不包括x86。全球排名前10位的超级计算机中,有6台是基于x86芯片的,只有1台是基于ARM的。

这对英特尔来说是一个很大的失利,该公司去年宣布将投资330亿欧元在欧洲建立一个新的芯片工厂,并为研发计划提供资金。英特尔CEO Pat Gelsinger也会见了欧盟领导人,试图在该地区获得更多业务。

Jülich最快的系统JUWELS上一次上榜是在2021年11月,目前排名第13位。欧洲最快的超级计算机是排名第三的芬兰Lumi,峰值性能为每秒309千万亿次,排名第四的意大利Leonardo,峰值性能为每秒239千万亿次。

Jupiter于2022年首次公布,它被设计成一个模块化系统,多种类型的加速器可以插入核心系统。这台超级计算机是由几乎相同的团队建造的,包括Eviden和系统集成商Partec,后者负责44千万亿次的JUWELS超级计算机,该超级计算机于2020年安装了AMD的Epyc 7402芯片。

Jupiter将采用SiPearl的ARM处理器,该处理器基于ARM的Neoverse V1 CPU设计。SiPearl的Rhea芯片可以普遍兼容多种加速器,并支持高带宽内存和DDR5存储。

Jupiter将配有Nvidia的Booster模块,这是一个集成系统,包括该公司的GPU和Mellanox互连。SiPearl一直在与Nvidia合作,将其CPU与NvidiaGPU连接起来。目前JUWELS Booster 模块使用Nvidia的A100 GPU, Jupiter可以升级到H100 GPU。

虽然英特尔和AMD可能是Jupiter交易的输家,但这并不妨碍它们的芯片被用于超级计算机。Jupiter的模块化设计意味着Jülich可能会选择将这些公司的GPU(不太可能是CPU)添加到插入核心计算系统的模块中。

英特尔与SiPearl进行了广泛合作,为Rhea提供了Ponte Vecchio超级计算GPU的OneAPI支持。SiPearl去年与AMD合作,让Instinct GPU与Rhea芯片兼容。

Jülich还在建设自己的机器学习和量子计算基础设施,超级计算中心希望将其作为加速器模块接入自己的设施。

总部位于法国的SiPearl利用欧洲处理器计划(European Processor Initiative, 简称EPI)的种子基金开始开发Rhea,该计划希望开发开放芯片设计,以减少对外国芯片技术的依赖。EPI主要关注基于开源RISC-V架构的芯片设计。

与老牌的英特尔和AMD相比,SiPearl是一家相对较新的芯片设计公司,目前正面临着证明其芯片可以支持百亿亿次浮点运算性能的压力。SiPearl之所以选择ARM,是因为ARM可以成熟用于高性能应用程序。专家表示,RISC-V距离主流服务器的采用还有很多年的时间。EuroHPC JU要求Jupiter供应商满足能效、性能、系统稳定性和可编程性要求。

Jupiter将运行经典的计算应用程序,也将服务于大语言模型等AI技术。AI应用可能包括创建模拟加速药物发现,或模拟天气问题以做出预测或解决与气候变化相关的问题。

Jupiter是欧盟在实现计算独立和减少对专有技术依赖的努力中迈出的一大步。欧盟委员会几个月前通过了《欧洲芯片法案》,为制造业、下一代半导体技术和研究提供了430亿欧元的公共资金。

该法规特别为HPC开放了20亿欧元,为AI开放了16.7亿欧元。HPC分配与在欧盟内部采购和建设超级计算和量子基础设施有关。然而,在建造世界上最快的超级计算机的竞赛中,欧洲仍然落后于美国、中国和日本。

美国预计将在未来几年拥有两台百亿亿次的超级计算机——ORNL的极光和Lawrence Livermore国家实验室的El Capitan——这将再次把欧洲甩在后面。中国已经暗示,多台百亿亿次超级计算机已经或预计将上线。

0 comments:

VxWorks

Blog Archive