intel于isc22 high performance国际超级计算机大会发布代号为sapphire rapids hbm的xeon处理器,以及ponte vecchio、rialto bridge、falcon shores等数据中心gpu。
intel表示公司积极规划hpc高性能计算产品,预计在2024年将可提供多样化的异质架构产品组合,除了可以大幅提升性能表现,同时还可以降低一般负载以及ai、加密和分析等新兴运算负载所消耗的能源。
即将推出、代号为sapphire rapids hbm的xeon处理器搭载高带宽内存(hbm),通过进封装技术将最高达64gb的hbm2e高带宽内存与加速运算单元集成至处理器内部,解放受限于内存带宽的工作负载表现,同时在关键hpc使用案例中提供显著的性能改善
将sapphire rapids hbm与第3代xeon可扩展处理器相互比较时,前者能够于天气研究、能源、制造和物理工作负载的性能提升2倍至3倍。工程模拟软件公司ansys首席技术官prith banerjee也在演说中实际展示sapphire rapids hbm能在ansys fluent和parsenet3等工作负载之中,提供高达2倍的性能提升。
intel表示在提升hpc和ai超级运算工作负载性能的过程中,运算密度也必要条件之一。代号为ponte vecchio的首款旗舰型英特尔数据中心绘图处理器(gpu),已在复杂的金融服务应用和ai训练与推论工作负载,提供超越竞争对手的表现。根据intel提供的数据,在高度逼真的openmc4模拟中,ponte vecchio可以带来2倍的加速效果。
intel也宣布代号为rialto bridge的新款数据中心gpu,借由推进ponte vecchio架构以及结合强化后的芯片块(tile)和次世代制程节点技术,rialto bridge将可提供显著增加的密度、性能和效率,同时保有软件一致性。
至于下个重大架构变革则是falcon shores,它将x86 cpu和xe gpu架构集成至单一插槽之中。这个架构预计在2024年带来超过5倍的电力效率、5倍的运算密度、5倍的内存容量与带宽等增益。
新款数据中心gpu rialto bridge最高具有160组xe运算核心,预计2023年提供样品。
falcon shores则是将x86 cpu和xe gpu架构集成至单一插槽的异质处理器。
intel表示再强的硬件也需要软件协助以发挥功效,其软件策略是促进整个堆栈的开放发展并提供工具、平台和软件ip,协助开发者提升生产力,创造更多可扩展、性能更好、更具效率的程序代码,能够汲取最新芯片创新的优势,同时不需要重新撰写程序代码,而让程序代码能够透明且移植到cpu、gpu与各种加速器的oneapi产业倡议就是其成果,目前已有超过20间的研究和学术机构具有oneapi研发中心并取得重大进展。
为了满足越来越多数据中心和hpc工作负载往异质运算的方向发展,intel也推出intel xpu manager以协助更有效率地管理这些复杂且多样化的运算环境。这款工具能在本机或远程监测与管理intel数据中心gpu,并通过执行全面性诊断,最大程度地提升可靠性和正常运行时间,改善使用率和执行固件更新,简化过去的管理流程。
此外intel也推出强化文件移动和存储资料等工作的daos(distributed asynchronous object storage)文件系统,提供系统层级的优化。daos对于文件系统的性能有着重大影响,同时改善整体访问时间和降低存储所需容量,并减少数据中心内服务器占用的空间并提升能源效率。在与lustre相关的i/o500结果之中,daos可完成直写式文件系统的70倍性能。
intel的软件策略除了包括能够让程序代码透明且移植到cpu、gpu与各种加速器的oneapi之外,也强调开放、选择、信任等原则。
daos(distributed asynchronous object storage)文件系统针对optane持续性内存、optane固态硬盘等设备提供系统层级的优化。
在io500 mdtest测试中,与lustre文件系统相比,daos能提供最高达70倍读取、5倍写入的性能增益。
在io500 ior hard测试中,daos能提供最高达24倍读取、14倍写入的性能增益。
平均而言,daos能带来7倍于lustre的访问性能。
intel表示将与客户和领先研究机构合作,实践永续和开放的hpc。近期也宣布与西班牙巴塞罗那超级运算中心共同合作,设立开创性的risc-v zettascale实验室,并持续与英国剑桥大学和dell合作,将目前的exascale实验室推进成新的剑桥zettascale实验室,共同创建一个强健的欧洲创新生态系统。