2014年6月23日--英特尔公司今天公布了其下一代英特尔® 至强融核™ 处理器(代号为Knights Landing)的更多细节信息,其中包括将它集成到封装之内的全新高速互连技术,以及同样会集成到封装内的高带宽内存,两者的结合使用将有望进一步加速科学发现的效率。现有的内存和互连技术通常作为服务器内的独立组件提供,而这限制了高性能计算机的性能和密度。
名为英特尔® Omni Scale Fabric的全新互连技术旨在满足下一代高性能计算的需求。它将被集成至下一代英特尔® 至强融核™ 处理器以及未来的通用英特尔® 至强TM 处理器中。这种集成举措以及为高性能计算优化的架构的互连架构能满足未来高性能计算部署对于性能、可扩展性、可靠性、功耗和密度的要求,它还可通过超大规模部署的方式,平衡入门级应用的价格和性能。
英特尔公司数据中心事业部副总裁兼工作站与高性能计算总经理Charles Wuischpard 表示:“通过在Knights Landing中集成英特尔Omni Scale Fabric,英特尔正在重塑高性能计算系统的基础构建模块。这标志着高性能计算行业一个重要的转折点和里程碑。Knights Landing将是首个真正的众核处理器,它可解决目前在内存和I/O性能上的挑战。它还能支持编程人员充分利用现有的代码和标准的编程模式,在广泛的应用上实现显著的性能提升。其平台设计、编程模式和均衡的性能使其朝着百亿亿级计算迈出了具有实践意义的第一步。”
Knights Landing——领先业界的“集成”
除了提供基于PCIe的插卡,Knights Landing还可作为独立的处理器,直接安装在主板插座中。这种产品型态可消除那些GPU和加速器解决方案在PCIe上传输数据时经常遇到的编程复杂性和带宽瓶颈问题。英特尔今天还透露:Knights Landing发布时将集成容量高达16GB的高带宽内存。这种新型内存将由英特尔和镁光(Micron)携手设计,与DDR4内存相比可将带宽提升5倍1,与现有的基于GDDR的内存相比可将能效提升5倍2 并将密度提升3倍2。当与集成的英特尔Omni Scale Fabric结合使用时,该内存可支持Knights Landing作为独立的计算构建模块进行安装,从而通过减少组件的数量来节省空间和能耗。
Knights Landing拥有超过60个为高性能计算优化的、基于Silvermont架构的内核,与当前一代产品相比,预计能够提供3 TFLOPS的双精度浮点计算性能3 ,并将单线程性能提升达3倍4。作为独立的服务器处理器,Knights Landing将支持在容量和带宽上可匹敌英特尔至强平台的DDR4内存,从而可支持占用较大内存空间的应用。Knights Landing将与英特尔至强处理器实现二进制兼容5,从而帮助软件开发人员轻松复用现有的代码。
对于倾向于使用独立组件和快速升级路径(无需升级其他系统组件)的客户,Knights Landing和英特尔Omni Scale Fabric控制器也可以独立的、基于PCIe的插卡型态来进行供货。目前提供的英特尔® True Scale Fabric和未来的英特尔Omni Scale Fabric间实现了应用兼容性,因此客户在迁移至新的互连技术时无需更改其应用。针对目前购买英特尔True Scale Fabric的客户,英特尔将于英特尔Omni Scale Fabric上市后为其提供相关的升级计划。
Knights Landing处理器计划于2015年下半年配备到商用系统中,后续将覆盖更多市场。例如,今年4月份美国国家能源研究科学计算中心(NERSC)曾宣布将于2016年实施一项高性能计算部署,该部署将服务超过5,000名用户以及超过700个超大规模科研项目。
美国劳伦斯伯克利国家实验室NERSC总监Sudip Dosanjh博士表示:“我们非常高兴能与Cray及英特尔一起合作开发NERSC的下一代超级计算机‘Cori’,它将使用9,300多颗英特尔Knights Landing处理器,可通过易用的编程模式为我们的用户提供通往百亿亿级计算的入口。我们经常受限于内存带宽的代码,也将大大受益于Knights Landing集成的高速内存。我们期待推动用现有超级计算机所无法实现的全新科技进展。”
英特尔Omni Scale Fabric:新的互连带来新的速度
英特尔Omni Scale Fabric专为下一代高性能计算设计和优化。其构建基础是英特尔从Cray和QLogic手中获取的相关技术的强化组合,并融入了来自英特尔自身的创新。它将提供全面的产品线,包括适配器、交换机、导向器级交换机系统、开放软件管理和工具。此外,现有互连技术的导向器级交换机中的传统电子收发器将由基于英特尔® Silicon Photonics 技术的解决方案所替代,后者可提升端口密度、简化布线并降低成本6。英特尔Omni Scale Fabric还将被集成到下一代14纳米制程的英特尔至强处理器中,充分发挥全新互连技术及其与业内最受欢迎的通用处理器产品家族相集成的优势。
英特尔架构高性能计算机保持强劲发展势头
现有的英特尔至强处理器和英特尔至强融核协处理器为全球范围内众多一流的高性能计算系统所采用,例如来自中国、性能达35 PFLOPS的天河二号(Milky Way 2)系统。现有的至强融核协处理器也被全球超过200款OEM设计所采用。为帮助优化适用于众核处理的应用,英特尔还与全球范围内的大学和研究机构合作建立了30多个英特尔并行计算中心(IPCC)。基于标准通用编程语言的优化可通过重新编译来实现持续使用,因此目前在英特尔至强融核协处理器上的并行优化投资将由Knights Landing所继承,递增的调优收益也将有助于充分利用Knights Langing的创新功能。
英特尔技术在第43届全球高性能计算机500强(TOP500)排行榜中也多次出现,继续扮演了全球最强大超级计算机标准构建模块的角色。在该榜单中,有85%的上榜系统为基于英特尔架构的系统,而在新上榜的系统中,则有97%为基于英特尔架构的系统。在英特尔推出其首款众核架构产品后的18个月内,基于英特尔至强融核协处理器的上榜系统所提供的性能,在所有500套上榜系统输出的总体性能中已能占据高达18%的份额。如欲查看完整的全球高性能计算机500强(TOP500)排行榜,请访问 www.top500.org。
关于英特尔