NVIDIA®(英伟达) 发布 CUDA 5,程序员可利用这一全球最普遍的并行计算平台更容易地编程
2012年10月15日 — 美国加利福尼亚州圣克拉拉市 —NVIDIA® (英伟达™) 于2012年10月15日推出了NVIDIA®CUDA® 5 正式版本 (Production Release) ,它是一个功能强大的全新版本。CUDA 是全球应用最为广泛并行计算平台与编程模型,可用于在 GPU 上加速科学和工程应用程序。大家可以从 NVIDIA® (英伟达™) 开发者专区网站免费下载这一全新版本。
CUDA 下载量现已超过 150 万,支持 180 多款领先的工程、科学以及商业应用程序,它是开发者利用 GPU 加速计算的最流行的方式。
在这一成功的基础之上,CUDA 5 全新的编程特性让程序员能够比以往任何时候都更快速、更轻松地开发出 GPU 加速的应用程序。这些特性包括支持动态并行机制、GPU 可调用的库、GPUDirect™ 对 RDMA (远程直接内存访问) 的支持以及 NVIDIA® Nsight™ Eclipse Edition 集成开发环境 (IDE)。
开发者对 CUDA 5 的赞誉
之前曾评估过 CUDA 5 预览版本的开发者报告称,该平台通常可大幅加速应用程序、改善可编程性。
国防与航空航天行业现在意识到了 CUDA GPU 加速在处理图像、视频以及雷达等传感数据方面的优势。 Dustin Franklin 是美国通用电气智能平台公司的 GPGPU 应用工程师,该公司位于美国弗吉尼亚州夏洛茨维尔。他表示:“CUDA 5 对我们来说是一项重要的技术。 我们使用的许多应用程序都涉及将传感器数据直接以流的形式发送至 GPU,这种方式具有低延迟的特点,因此对我们的客户来说,全新 Kepler GPU 上针对 RDMA 的 GPUDirect 支持相当重要。 我们已经整合了对诸多客户传感器的支持,结果令人非常满意。”
Guillaume Belz 是在法国里昂市里昂大学医院从事研究工作的一名生物化学家。他长期以来一直利用动态并行机制和 GPU 可调用的库来进行复杂的信号分析和数据挖掘。 Belz 指出:“在过去只使用 CPU 需要数周甚至数月时间才能完成的那些项目上,我们借助 GPU 加速便能够在数小时内得出结果。 在没有 GPU 加速的情况下,根本无法完成分析。”
孙伟华 (音译, 英文名为 Wayne) 是纽约罗彻斯特理工学院成像科学的博士生候选人,NVIDIA® Nsight Eclipse Edition 给他留下了十分深刻的印象。 “当我得知 CUDA 5 包含全新的 Nsight Eclipse Edition IDE 时我就知道,我马上就需要它。对我来说,把我用到的所有编程、调试以及优化工具集成到单一开发环境中将会大幅提升生产率。”
CUDA 5 新特性
CUDA 5 让开发者能够充分利用 NVIDIA® GPU 的性能,其中包括基于 NVIDIA® Kepler™ 计算架构的那些 GPU 加速器。该架构是史上最快、最高效、性能最高的计算架构。 主要特性包括:
•动态并行机制 – 为新算法带来了 GPU 加速
GPU 线程可动态生成新线程,让 GPU 能够适应数据。 通过最大限度减少与 CPU 之间的数据交换,动态并行机制大大简化了并行编程。 它还让 GPU 能够加速更广范围的流行算法,例如自适应网格加密和计算流体力学应用程序中所使用的那些算法。
•GPU 可调用的库 – 能够打造第三方生态系统
全新的 CUDA BLAS 库让开发者能够将动态并行机制用于他们自己的 GPU 可调用库。 他们可以设计插件 API,以便让其它开发者能够扩展其内核的功能,也让他们能够在 GPU 上实现回调 (Callback) 以便定制第三方 GPU 可调用库的功能。 “对象链接” 功能提供了一个高效而熟悉的过程,让开发者能够将多个 CUDA 源文件编译成单独的对象文件并将其链接至更大的应用程序和库,从而可开发出大型 GPU 应用程序。
•针对 RDMA 的 GPUDirect 支持 – 可最大限度减少系统内存瓶颈
于NVIDIA® (英伟达™) 公司 GPUDirect 让 GPU 与其它 PCI-E 设备之间能够实现直接通信,另外还支持网卡与 GPU 之间的直接内存访问。 它还大幅降低了一个集群中 GPU 节点之间的 MPISendRecv 延迟,提升了整体应用程序性能。
•NVIDIA® Nsight Eclipse Edition – 可快速而轻松地生成 CUDA 代码
它让程序员能够在 Linux 和 Mac OS X 平台上在自己所熟悉的 Eclipse IDE 中开发、调试以及分析 GPU 应用程序。集成的 CUDA 编辑器和 CUDA 样本可加速生成 CUDA 代码,而自动代码重构功能则可以轻松将 CPU 循环移植至 CUDA 内核。集成的专家分析系统可提供自动化性能分析与逐步向导功能,以便修正代码中的性能瓶颈问题。句法突出显示功能可以轻松区分 GPU 代码与 CPU 代码。
全新的在线 CUDA 资源中心
为帮助开发者利用 CUDA 最大限度发挥出并行计算的潜力,NVIDIA® (英伟达™) 现已为 CUDA 程序员推出了免费的在线资源中心,网址为 http://docs.nvidia.com。 该网站可提供 CUDA 平台与编程模型的最新信息,另外还让大家能够访问所有 CUDA 开发者文档和技术,其中包括工具、代码样本、库、API 以及调谐和编程指南。
CUDA 注册开发者计划
我们邀请并行程序员参加免费的 CUDA 注册开发者计划,以便提前获得新版软件、工具以及资源。 如需了解更多信息,敬请访问 www.nvidia.com/paralleldeveloper。
关于 CUDA
CUDA 是 NVIDIA® (英伟达™) 发明的一种并行计算平台和编程模型。 该平台通过利用 GPU 的处理能力,可大幅提升计算性能。