黄仁勋-英伟达半导体科技(上海)有限公司总裁介绍
个人简介:
姓 名:黄仁勋
性 别:男
民 族:汉
国 籍:美国
出 生 地:台湾省台北市
出生日期:1963年2月17日
毕业院校:俄勒冈州立大学
职 业:IT企业家
语 言:英语,少量汉语
主要成就:参与创建NVIDIA
人物小结:
黄仁勋,美籍华人,1993年创办NVIDIA―今天全球最大显卡芯片厂商之一。2001年黄仁勋在《财富》“40岁以下最富40 人”排名第12位,位列在篮球明星乔丹之前。黄仁勋为人不张扬,国内很少有人知道这位杰出华人的成功之路。其实他的成绩已经足够与王安、王嘉廉和杨致远等华人IT精英并驾齐驱。
英伟达CEO黄仁勋:做与众不同的事
在企业界,黄仁勋作为英伟达联合创始人、总裁兼CEO,十多年来励精图治,将英伟达打造成了最大的独立图形计算厂商,因而成为华人在国际企业界的骄傲。如今,他再创辉煌,成功地抓住了高性能计算(HPC)与视频计算的历史性机遇。
在IT界,他曾经以“黄氏定律”而闻名,“显卡性能每半年翻一倍”似乎要叫板摩尔定律,其实摩尔定律使的是猛劲——全力提高工艺水平,而“黄氏定律”用的是巧劲——主要是通过改进架构来实现。
我们面前的黄仁勋,则是一个总把“为产业和社会做出独特贡献”挂在嘴边的人。
领衔高性能计算
刘保华:2008年,IBM混合架构的“走鹃”在成为首台突破千万亿次大关的超级计算机的同时,证明了流处理器在HPC(高性能计算)中的加速作用,进而间接地证明了GPU在HPC中的地位。如今,GPU已经在HPC上唱起了主角。你认为GPU在HPC领域还有哪些挑战?
黄仁勋:“走鹃”是世界上第一台采用异构计算的方式进行数据处理的超级计算机,它同时采用了顺序处理器和并行处理器两种处理方式。而英伟达的 GPGPU(通用图形处理器)属于第二代的异构计算解决方案。最近,在全球排名第二的曙光“星云”超级计算机中,英伟达的GPGPU已经成为最重要的处理器。
GPU 计算面临的挑战就是编程效率。我们要让习惯于串行编程的程序员学会并行思考;其次,我们还要为他们提供高效易用的软件工具,这也就是我们基于CUDA通用并行计算架构设计的GPGPU芯片Fermi,要支持CUDA Fortran、CUDA C 和 CUDA C++等多种高级语言的原因。事实上,“走鹃”面临的最大障碍在于编程非常复杂。
刘保华:为什么HPC500强中有的混合架构超级计算机的效率并不高?
黄仁勋:原因很简单,那些超级计算机采用的是其他厂商的GPU。你可以让 GPU 执行部分并行程序,但前期要做的工作非常多,而且效益不高。与GPU使用OpenGL、DirectX等图形编程接口不同,英伟达的GPGPU采用的 CUDA架构是一种真正的并行计算架构,其不仅仅限于图形计算。这也解释了为何现在有如此多的 CUDA 应用程序,为何 CUDA 能够在科学领域得到广泛应用,为何有如此多的 CUDA 书籍,以及为何各所大学纷纷开设 CUDA 课程。
刘保华:GPU在图形应用时,没有ECC(错误检查和修复)功能问题还不大。而在科学计算和模拟时,如果GPU不支持ECC的话,一个很小的错误经过多次的迭代计算,最终会出现 “失之毫厘谬以千里”的情况。
黄仁勋:是的,HCP进行一次大的模拟需要耗费几天才能完成。如果结果不正确,则需要重头再来,成本相当高。超级计算机通常有数千个GPU,如果某一个GPU在第三天出现了一个错误,这三天的电费和时间就全都浪费了。在超级计算领域,ECC校验是必备的。所以我们才在设计阶段加大投入,并加大设计难度,将ECC单元植入Fermi。事实上,在GPU市场只有英伟达能够提供对ECC的支持。
刘保华:如果没有ECC,想要确认计算结果是否正确的方法,是不是只有再算一次?
黄仁勋:可能还不止。假如第二次跟第一次的结果还不一样,那只有再算一次。假设一共算三次,那我们就希望有两次结果是一样的。
刘保华:GPU要想在云计算中大显身手,是否必须直面虚拟化方面的挑战?
黄仁勋:CPU因为MMU(内存管理单元)、多任务处理的关系,虚拟化很容易。GPU不具备MMU,它非常擅长完成单个非常大的任务,并不十分擅长多任务处理。你说的不错,我们必须发明新的技术,以使GPU不仅能够非常适合并行处理,而且还适合多任务处理以及虚拟化的要求。等我们完成这一重大的创新后,就能够将GPU置于云端。
刘保华:分布式是否是未来HPC发展的趋势?
黄仁勋:未来将会出现非常庞大的超级计算中心,大量的超级计算中心构成一个巨大的网络,同时超级计算机也会存在于你的桌面上。大型模拟计算可以在超级计算中心完成,更为庞大的模拟计算则可以依靠云计算中的超级计算机来完成。在未来,超级计算能力将通过连续的设施来提供,从云到超级计算中心,再到个人超级计算机,它们将运行相同的程序。