随着我们进入Exascale时代并加速迈向Zettascale,科技产业对于全球碳排放量的贡献也随之成长。预计到2030年,数据中心将会消耗全球总发电量的3%至7%1,而运算基础设施所需电力将占据新能源使用量的首位。
今年英特尔承诺在2040年以前,达成全球营运范围内的温室气体净零排放,并持续开发更具永续性的解决方案。追随永无止境运算需求的同时,还要创造一个可永续的未来,这是高效能运算(HPC)最大的挑战之一。如果我们逐一解决HPC运算堆栈中的各个部分—芯片、软件和系统,仍可达成此一愿景。
这就是英特尔在德国汉堡ISC 2022主题演说的核心。
从芯片和异质运算架构迈开步伐
英特尔有项积极的HPC产品规划,到了2024年将可提供多样化的异质架构产品组合。这些架构让英特尔能够提升数个量级的效能表现,同时降低一般负载以及AI、加密和分析等新兴工作负载的能耗需求。
搭载高带宽内存(HBM)的Intel® Xeon®处理器,代号Sapphire Rapids HBM的产品即是一个很好的例子,阐述英特尔如何利用先进封装技术和芯片创新,为HPC带来实质性的效能、带宽和省电等多方面改善。凭借封装当中最高达64GB的高带宽HBM2E内存,以及整合进入CPU的加速器,英特尔能够解放受限于内存带宽的工作负载表现,同时在关键HPC使用案例中提供显著的效能改善。第3代Intel® Xeon®可扩充处理器与即将推出的Sapphire Rapids HBM处理器相互比较时,于天气研究、能源、制造和物理工作负载的效能提升2倍至3倍2。在本次主题演说当中,Ansys技术长Prith Banerjee 也展示在实际的Ansys Fluent和ParSeNet3工作负载之中,Sapphire Rapids HBM可提供高达2倍的效能提升3。
英特尔于提升HPC和AI超级运算工作负载数个量级效能的过程当中,运算密度是另外一个必要条件。我们首款旗舰型英特尔数据中心图形处理器(GPU),代号Ponte Vecchio,已在复杂的金融服务应用和AI训练与推论工作负载,提供超越竞争对手的表现。英特尔还展现高度逼真的OpenMC4模拟,采用Ponte Vecchio加速可达2倍4。
英特尔并不会就此打住,我们今日更宣布新款强大的数据中心GPU,代号Rialto Bridge。藉由推展Ponte Vecchio架构以及结合强化后的芯片块(tile)和次世代制程节点技术,Rialto Bridge将可提供显著增加的密度、效能和效率,同时保有软件一致性。
展望未来,Falcon Shores是英特尔产品规划的下一个重大架构创新,将x86 CPU和Xe GPU架构整合至单一插槽之中。这个架构预计在2024年带来超过5倍的每瓦效能、5倍的运算密度、5倍的内存容量与带宽等进步5。
成功软件策略的原则:开放、选择、信任
如果没有软件将其融入生活,芯片就只是砂粒般的存在。英特尔的软件策略是促进整个堆栈的开放发展并提供工具、平台和软件IP,协助开发者提升生产力,创造更多可扩展、效能更好、更具效率的程序代码,能够汲取最新芯片创新的优势,又没有重新建构程序代码的负担。oneAPI产业倡议提供HPC开发者跨架构的程序设计环境,因此程序代码能够透明且可移植地,在CPU、GPU,以及其它专门的加速器上运作。
目前领先全球的研究和学术机构,有着超过20间的oneAPI卓越中心,均取得重大进展中。以Simon McIntosh-Smith及其英国布里斯托大学科学学系团队作为例子,他们正在利用oneAPI和Khronos Group的SYCL抽象层进行跨架构程序设计,开发可在Exascale层级达成效能移植的最佳作法。他们的工作将确保科学程序代码,能够在全球大规模的异质超级运算系统达到高效能。
相互结合:永续的异质运算系统
随着越来越多数据中心和HPC工作负载朝向解构和异质运算的方向移动,我们将需要能够协助更有效率地管理这些复杂且多样化的运算环境。
英特尔今日推出Intel® XPU Manager,一款在本机或远程监测与管理英特尔数据中心GPU的开源解决方案。这款方案专为简化管理而设计,并透过执行全面性诊断,最大程度地提升可靠性和正常运作时间,改善使用率和执行韧体更新。
Distributed Asynchronous Object Storage(DAOS)文件系统为移动和储存数据等耗电任务,提供系统层级的优化。DAOS对于文件系统的效能有着重大影响,同时改善整体访问时间和降低储存所需容量,并减少数据中心所占面积和提升能源效率。在与Lustre相关的I/O 500结果之中,DAOS可达成直写式文件系统的70倍效能6。
应对HPC永续性挑战
英特尔很自豪能够与全球各地志同道合的客户和领先研究机构合作,实践更为永续和开放的HPC。近期的例子包含英特尔与西班牙巴塞罗那超级运算中心共同合作,设立一座开创性的RISC-V Zettascale实验室,英特尔也持续与英国剑桥大学和Dell合作,将目前的Exascale实验室推展成新的剑桥Zettascale实验室。这些努力都建立在英特尔为未来运算所拟定的计划,建立一个强健的欧洲创新生态系。
没有任何一家公司能够独立做到这点。整个生态系包含制造、芯片、互连、软件和系统,都需要同步投身其中。藉由这些共同努力,我们可以将本世纪最大的HPC挑战之一,转变成本世纪的最大的机会之一,并替未来世代改变这个世界。