NVIDIA®(英伟达™) 推出 CUDA 6,大大简化并行编程

本文作者:NVIDIA       点击: 2013-12-02 16:51
前言:
统一内存、插入式库以及其它全新的可编程性特性将惠及下一拨 GPU 开发者
2013年11月14日--美国加利福尼亚州圣克拉拉— NVIDIA®(英伟达™) 今天发布了 NVIDIA® CUDA® 6 —— 全球最普遍的并行计算平台与编程模型的最新版本。
 
CUDA 6 平台让并行编程变得比以往更加轻松,让软件开发商在利用 GPU 加速科学、工程、企业以及其它应用时能够大幅缩短所需时间和减少所耗费的精力。 
 
它包含全新的性能增强内容,让开发者只需替换掉基于 CPU 的现有库,即可快速令应用程序速度提升 8 倍。 CUDA 6 的主要特性包括:
统一内存 (Unified Memory) – 让应用程序能够读写 CPU 与 GPU 存储器,无需在这二者之间手动复制数据,从而简化了编程。另外也让开发者能够更轻松地用各种编程语言在应用程序中添加对 GPU 加速的支持。
插入式库 (Drop-in Libraries) – 只需用 GPU 加速的库来替代现有的 CPU 库,即可自动加速应用程序的 BLAS 和 FFTW 运算,最高令其速度提升 8 倍。
多 GPU 扩展 – 重新设计的 BLAS 和 FFT GPU 库最多能够在单一节点的 8 颗 GPU 上自动扩展性能,可实现每个节点 9 Teraflops 以上的双精度性能,支持比以往更大的工作负荷 (最高 512GB)。多 GPU 扩展还可以用在全新的 BLAS 插入式库上。
 
桑迪亚国家实验室可扩展算法部门经理 Rob Hoekstra 表示: “通过自动应付数据管理,统一内存让我们能够快速制作出在 GPU 上运行的内核原型并降低代码复杂度,从而最高可令开发用时缩短一半。当我们确定未来的编程模型选项并将更复杂、更大型的代码移植到 GPU 上时,这一功能将非常实用。”
 
Fabric Engine 公司首席执行官 Paul Doyle 指出: “我们的技术现已帮助各大工作室、游戏开发商以及动画师制作出了视觉效果绝佳的 3D 动画与特效。这些客户一直催促我们添加对 NVIDIA® GPU 加速的支持,然而实践证明,在处理复杂的制作场合时内存管理是一大难题。借助统一内存,内存管理实现了自动处理,从而让 Fabric 编译器能够针对 NVIDIA® GPU,让我们的客户能够实现最高 10 倍的应用程序速度提升。”
 
除了这些全新特性以外,CUDA 6 平台还提供了一整套编程工具、GPU 加速的数学库以及文档和编程指南。
CUDA Toolkit 版本 6 预计将于 2014 年初问世。当它可供下载之时,CUDA-GPU 计算注册开发者计划将会提醒大家。想要参加该项计划,敬请点此注册。
 
如需了解有关 CUDA 6 平台的更多信息,敬请于 11 月 18-21 日在丹佛举办的 SC13 大会上光临 613 号 NVIDIA®(英伟达™) 展台、访问 NVIDIA® CUDA 网站。
 
关于 CUDA
CUDA 是 NVIDIA®(英伟达™) 开发的一种并行计算平台和编程模型。该平台通过利用 GPU 的处理能力,可大幅提升计算性能。CUDA 编程模型下载量已逾 200 万,支持 240 多款领先的工程、科学以及商业应用,全球 700 多所院校开设了这一课程,它在充分利用 GPU 加速计算这方面是广大开发者所采用的最流行的方式。
 
大家可通过下列方式持续关注 NVIDIA®(英伟达™): 
在 Facebook 上关注 NVIDIA®。
在 LinkedIn 上与 NVIDIA® 建立联系。
在 Twitter 上关注 @NVIDIA®Tesla 以及 @GPUComputing。
在 YouTube 上观看 NVIDIA® 视频。
持续关注 NVIDIA® 博客和开发者全民并行博客。
使用 Pulse 新闻阅读器来订阅 NVIDIA® 日常新闻递送。
 
关于NVIDIA® (英伟达™) 公司
自从1993年以来,NVIDIA ®(英伟达™) (纳斯达克代码: NVDA) 一直在视觉计算的艺术与科学发展中勇当开路先锋。NVIDIA ®(英伟达™)公司的诸多技术正在彻底转变显示世界的面貌,使其成为充满互动与探索的世界,这将影响所有人,不论是游戏玩家、科学家还是消费者或者是企业客户。如需了解更多信息,敬请访问:
NVIDIA®新浪微博:http://e.weibo.com/nvidiachina
NVIDIA®腾讯微博:http://t.qq.com/NVIDIAChina