英特尔降低高性能计算复杂性 加速获取人工智能洞察

本文作者:英特尔       点击: 2016-11-25 12:56
前言:
2016年11月15日--如今,高性能计算(HPC)在企业以及各行各业中的应用日益普遍,从天气预报、产品开发到疾病诊断,在各种复杂问题处理中都能看到它的身影。因此,降低HPC系统复杂性,平衡性能及按需扩展等需求也不断增长。此外,业界也在寻求如何降低人工智能在多种商业、政府和学术中应用的门槛。在今天于犹他州盐湖城举行的2016年全球超级计算大会上,英特尔宣布对其HPC产品组合做出多项重大更新,并将研发多项新技术,以期帮助解决这些棘手问题。
 
英特尔® HPC Orchestrator 
英特尔® 可扩展系统框架 (英特尔® SSF)致力于平衡和优化计算、内存、存储、能效及其他各方面的性能。英特尔 SSF是一种高级架构方法,可简化HPC系统的采购、部署和管理。英特尔致力于通过提供经过验证的可靠、模块化的整合性HPC软件平台来简化系统管理,从而引领整个生态系统的转型。
 
·英特尔® HPC Orchestrator现已上市,HPC系统构建商、应用开发商和最终用户可利用此软件平台提高系统设置和管理效率,支持大规模测试并简化用户部署。英特尔® HPC Orchestrator 是一种可定制平台,既支持传统HPC工作负载,也支持机器学习、高性能数据分析和无人驾驶等新兴用途。
·英特尔® HPC Orchestrator基于OpenHPC 社区系统软件堆栈,包括多种编译器选项、MPI系列、基本操作系统组合以及协助自动安装的工具。此外还集成了具有90天评估许可的英特尔® Parallel Studio XE Cluster Edition 产品,可提供初始下载后的便捷安装。
·作为英特尔 SSF的重要组件,英特尔® HPC Orchestrator包括60余种预集成的模块化组件,并提供持续更新和技术支持服务。这可帮助HPC系统开发人员和用户将其技术资源专注于增强HPC解决方案并建立差异化优势。
·英特尔® HPC Orchestrator现通过OEM启动系统供应商戴尔* 和富士通* 进行发售,很快将会推出其他发售渠道。

英特尔占据Top500份额前列;英特尔® OPA份额增长2.5倍 
上市仅9个月的时间,英特尔® Omni-Path 高速互联架构 (英特尔® OPA)已成为100 GB 系统的标准架构。在2016年全球超级计算大会上公布的全球超级计算机500强中,有28套使用了英特尔 OPA,且在100 GB系统中占比66%1。这些全球500强系统包括Oakforest-PACS、MIT林肯实验室和CINECA。
 
·在此次大会评选出的500强超级计算机名单中,共计28套集群部署了英特尔OPA,该数据是InfiniBand* EDR系统的两倍,在所有100GB系统中的比例约为66%。此外,还有两个系统位居前15位:Oakforest-PACS以8,208个节点排名第6,CINECA则以3,556个节点排名第12。在本次榜单中,英特尔 OPA系统的每秒总浮点运算达到43.7千万亿次(Rmax),这是所有InfiniBand* EDR系统浮点运算次数的2.5倍。
·英特尔 OPA具有高性能、高性价比以及错误检测和无额外延迟纠正等创新架构功能,可提供极为显著的客户优势,因此在大规模发售仅9个月内,市场采用率迅速增长。
·英特尔 OPA是一种端到端互连解决方案,可提高不同规模集群的HPC工作负载。与InfiniBand EDR相比,该解决方案将应用性能提高了9%,并将平均架构成本降低了37%之多2。
·目前已部署安装英特尔 OPA的包括日本东京大学、筑波大学(JCAHPC)、德州理工大学、华盛顿大学、科罗拉多大学波尔德分校、麻省理工学院林肯实验室和马来西亚气象局。目前全球已成功部署了100多套英特尔 OPA集群,这主要得益于其富有竞争力的基准性能和领先的性价比。
 
借助英特尔® Deep Learning Inference Accelerator加速AI实现 
·凭借其业内领先的性能和强大的软件生态系统,基于英特尔的平台几乎为所有HPC和机器学习工作负载提供支持。借助英特尔® Deep Learning Inference Accelerator,英特尔在2017年扩大了AI解决方案产品组合。英特尔® Deep Learning Inference Accelerator是一种基于现场可编程门阵列(FPGA)的集成软硬件解决方案,可用于神经网络加速。
·英特尔® Deep Learning Inference Accelerator 可为图像识别应用提供可扩展的加速解决方案,为数据中心带来出色的吞吐量和能效,从而使用户能够在数分钟内部署深度学习解决方案。
·其硬件采用了专为卷积神经网络(CNN)目标拓扑优化的英特尔® Arria® 10 FPGA插入板。其基于FPGA的架构可支持远程更新,因此可随着AI领域的快速创新及时更新硬件。
·可通过英特尔® Distribution for Caffe* 和 英特尔® Math Kernel Library for Deep Neural Networks (英特尔® MKL-DNN)等行业标准框架对英特尔® Deep Learning Inference Accelerator进行软件编程。
·英特尔® Deep Learning Inference Accelerator 将于 2017年上市。
 
扩展英特尔SSF生态系统 
英特尔及其生态联盟合作伙伴不断发布大型系统、优化解决方案、新工具和资源以及新英特尔 SSF 计划,以扩展英特尔 SSF生态系统。
 
最近,下列企业和组织采用了英特尔 SSF:
·MIT林肯实验室等领先大学和研究中心在其500强的超级计算机中部署了英特尔 SSF。
·HPE 将英特尔 SSF 集成至HPE下一代测序解决方案版本中,以提高基因测序的速度和成本效益。
·戴尔将英特尔 SSF 集成到用于生命科学领域的戴尔HPC系统,以加快包括药物设计、癌症研究、农业和法医学在内的多个领域的信息转化。
·英特尔发布了英特尔® Cluster Checker 2017更新。这款全面诊断工具在英特尔® Parallel Studio XE 2017 中发行,支持英特尔® 至强® 处理器、英特尔® 至强融核™ 处理器、英特尔 OPA和适用于Lustre* 的英特尔® 企业版软件。
 
英特尔® 至强融核TM处理器系列更新 
·英特尔® 至强融核™ 处理器 7210、7230、7250 和 7290 系列现已发售,集成英特尔 OPA的处理器计划于本月大量发售。
·50余种基于英特尔® 至强融核™ 处理器的HPC设计已在业内得到广泛采用。
·最新的英特尔® 至强融核™ 处理器已部署于全球超级计算机500强中的9个新系统,其中有2套系统排名前10,它们分别是排名第5的Cori系统和排名第6的Oakforest-PAC系统。此外,英特尔也是支持排名第20位的系统——Theta系统中橡树岭、阿贡、劳伦斯利弗莫尔合作项目(CORAL)的主要合约方。Theta系统将有助于提高美国在科学研究中的领导力3。
·英特尔扩大了在日本、韩国、欧洲和美国的全球合作,因而推动了针对基于英特尔® 至强融核™ 处理器的平台的开发者使用计划。
·英特尔® 至强融核™ 协处理器将于2017年初上市。
 
英特尔® 至强® 处理器不断创新 
英特尔® 至强® 平台几乎为所有HPC和机器学习工作负载提供支持。为了进一步推进该成果,英特尔推出了速度最快的双路处理器——英特尔® 至强® 处理器 E5-2699A v4系列。
 
·英特尔® 至强® 处理器E5-2699A v4 系列可提供面向数据密集型应用所需的业界领先性能,为想通过广泛部署的数据中心获得高性能的用户提供了绝佳的选择。
·在2016年全球超级计算大会上,英特尔将公开展示一款搭载下一代英特尔® 至强® 处理器早期版本的HPC集群,该处理器集成了英特尔 OPA、英特尔® 高级矢量扩展指令集-512 (英特尔® AVX-512)以及英特尔® 至强融核™ 处理器。
·英特尔® AVX-512 处理器指令集于2016年6月与最新一代英特尔® 至强融核™ 处理器一同发布,致力于加快压缩和加密算法的速度。它可提供硬件增强型数据保护并加快信息转化,同时提高多种HPC应用中所采用的浮点运算的速度。
 
关于英特尔 
英特尔致力于拓展科技疆界,让最佳精彩体验成为可能。如需了解更多信息,请访问英特尔中国新闻中心newsroom.intel.cn 以及官方网站intel.cn