曙光服务器品牌董事长李国杰访谈
中国工程院院士李国杰
1992年863计划投入200万元研制曙光一号,1995年以曙光一号2000万元知识产权为基础成立了曙光信息产业有限公司。十年后的今天,曙光公司已成为国内影响最大的服务器公司。
虽然从资产和管理规模上讲,曙光公司还不到国外大公司的百分之一,但曙光高性能服务器已在市场上占有一席之地,并且对我国经济发展、国家安全起到了不可替代的作用。从发射神舟飞船的基地到东方石油公司设在国内外包括非洲、中东和南美洲的勘探计算机房,从中国最大的超级计算中心(上海超算中心)到许多大学的网络中心,从涉及国家长治久安的信息安全部门到全国最大的证券交易所都能看到曙光高性能服务器的身影。曙光公司是我国高技术领域依靠自主创新发展壮大的一个范例,值得我们认真分析总结。
自主创新必须要有以弱胜强的胆识与魄力
一般而言,外国对手越强大,国人越不敢通过自主创新与之竞争。常听到的理由是:“外国大公司有几万人做研发,每年科研投入数十亿美元,中国一家小公司与他们竞争无异于以卵击石。”曙光的对手就是这样的巨无霸。既然下决心要发展自己的高性能计算机产业,首先就要对这种强弱悬殊的差距有清醒的认识,并且有以弱胜强的坚定信心。曙光公司的自信心不是基于朴素的爱国热情,而是基于对高性能计算机技术究竟有多深奥的本质了解。从上世纪50年代末开始,中科院计算所研制了一代又一代的计算机,已具备较深厚的技术积累。可以说,在计算机领域并不存在对我们而言深不可测的禁区。我们的投入少,不可能在计算机的各项技术上都赶上或超过外国大公司,但在精心选择的某些技术方向上后来居上是完全可能的。曙光人十年实践再一次证明了毛泽东同志做出的“我们要在战略上藐视敌人,在战术上重视敌人”的论断是以弱胜强的法宝。尽管竞争对手不是敌人,但战略上藐视强手是高技术企业成功的起点。
所谓胆识和魄力不仅仅是指高技术产品的研制者敢于以自主创新的技术与强手竞争,而且敢于与国内零部件及配套企业合作,共同增强整个产业链自主创新的能力;更重要的是,高技术产品的应用部门要相信中国人有能力自立于世界民族之林,要敢于采用国产的高技术产品,要像韩国人一样“身土不二”,具有扶植本土高技术产业的责任心。我国有些高技术产业发展不起来不是中国人笨,产品做不出来,而是某些使用部门的决策者没有胆识和信心,不敢拍板采用。过去的喷气式飞机如此,最近国产高速机车的遭遇可能也是如此。
成功的自主创新要基于正确的技术决策
在信息技术领域,并不是遍地都是黄金,随便做什么“自主创新”都能赚钱。相反,在强手如林的形势下,我们可能超越对手的技术方向并不多。成功的自主创新必须基于正确的技术决策。也就是说,在信息领域,选择做什么甚至比知道怎么做还重要,正确的选择技术方向是成功的一半。
曙光十年发展中,经历了几次重大的技术方向决策,有些甚至是技术转折。值得庆幸的是,曙光公司基本上都做出了正确决策,曙光能发展到今天也与这些正确的技术决策有关。
曙光公司赖以注册成立的曙光一号本身就是正确技术决策的结果,如果继续沿着863计划原定的智能计算机方向走,走日本五代机的路,就不可能诞生曙光公司。
曙光1000大规模并行机完成时,全世界TOP500的超级计算机中90都是向量机和大规模并行机,机群系统在市场上还不成气候。当时智能中心根据计算机标准化和摩尔定律发展趋势,大胆地进行技术方向转向,大力发展机群技术特别是还未形成工业标准的机群操作系统。同时,曙光公司根据用户的实际需求将研发重点从追求单项性能指标转向可扩展性、易用性、可管理性和高可用性、即SUMA特色,并将“It' UMA”注册成曙光服务器的商标。以提高服务器的可维护性为主要目标的监控系统已成为曙光各档服务器的重要特色,并被众多企业仿效,现已成为事实上的行业标准。曙光1700、曙光4000L等天潮系列产品能被石油等部门广泛采用也得益于发展机群技术这一重大技术决策。
曙光3000推出以后,机群系统已成为市场上高性能计算机的主流产品,如何在技术上更上一层楼,突破传统机群系统这一“天花板”,这又成为曙光公司和智能中心面临的重大技术难关。在曙光4000A的研制中,曙光公司和智能中心率先研制了几种网格零件,使曙光4000A真正成为面向网格的服务器,同时提出融合机群与大规模并行机技术的大规模机群系统(MCC)新方向,使MCC像大规模并行机(M )一样高效又像机群系统一样廉价。这一决策使曙光服务器又迈上新的台阶。另外,根据不同行业的需求,曙光公司及时提出了“整合计算、细分应用”的“瘦身计划”,变通用服务器为适合行业应用的服务器。与AMD结成战略联盟,率先在国内推广64位服务器也是曙光公司做出的重要技术决策。2003年64位服务器还很少人采用,率先推出64位服务器考验了曙光人对技术与市场的判断力,同时也得到了先行者的收获。
从集成创新到核心技术创新
曙光的自主创新走的是一条“有所为有所不为”、从集成创新到核心技术创新的务实道路。曙光创业初期,一方面自己的力量弱,另一方面曙光品牌尚未得到用户认可,如果一台服务器从芯片、主板、互联网络到操作系统与应用软件都自己做,用户很难接受。曙光公司从集成创新做起,先走增值OEM的起步之路,节点部件和操作系统采用市场主流产品,自己主要做把若干节点集成起来的机群操作系统以及提高整机可用性(可靠性与可维护性)的增值部件。这一务实的技术路线得到用户认可。几年以后,曙光公司开始自己设计开发主板,采取开放源码的Linux操作系统。曙光公司率先在市场上推出2U4CPU的64位主板,最近又推出8CPU16路并行的节点机,在服务器主板技术方面已走到国际前沿。下一步曙光就要采用国产的CPU芯片,从明年开始曙光公司将采用龙芯2ECPU做低档服务器。十一五期间,中科院计算所将推出多核多线程的高性能CPU,不仅可用于研制百万亿次甚至千万亿次的曙光5000和曙光6000,而且可研制低成本的高性能服务器,促使高性能计算机大众化。从集成创新到越来越深入的核心技术创新,曙光公司一步一个脚印在不断增强自主创新能力。
创新的精髓在于不亦步亦趋地跟着别人走老路。近十几年来,外国公司主要致力于不断提高CPU芯片与服务器的性能。但仔细分析目前各单位使用的计算机就会发现,PC机和服务器的利用率都很低。对于我们这种人口众多而资金有限的发展中国家,一定要走低成本信息化的新路,建设节约型的国家。智能中心与曙光公司高举“低成本”的旗帜正在低成本服务器方面进行大胆开创性的原始创新。未来两三年内曙光公司争取推出1—2万元一台的千亿次加速附件,使大学生和一般科研人员的桌面都有千亿次计算能力。超级计算机的成本也要降到每万亿次几十万元的水平。另一方面,要对各企业、事业单位现有的计算机系统进行革命性的改造,通过CPU服务器、存储器服务器等能力服务器给用户提供所需要的计算、存储能力,而整个计算机系统的成本将成数量级地降下来。现有的机群系统将做在一块主板上甚至芯片内部,形成板上机群系统甚至片内机群系统。光互联也要做到板上甚至片内。总之,在以后的日子里,曙光服务器的创新将越来越自主,越来越与众不同。
体制创新是自主创新的保证与动力
自主创新不是个人的行为,科技人员个人才智的发挥要靠机制、体制创新。从这种意义讲,机制重于技术。制度创新学派的主要人物诺斯指出:“对经济增长起决定性作用的是制度性因素,而非技术因素,有效率的经济组织是经济增长的关键。”我国长期存在的科研与经济脱离的两张皮机制是制约自主创新的桎梏。智能中心和曙光公司为解决两张皮问题做了十年探索,不断调整科研单位与企业的关系。前五年智能中心曾作为曙光公司的研究开发部进入公司,后五年智能中心又回到计算所,但仍和曙光公司保持密切联系。智能中心作为国立科研机构既不能下沉到做与企业一样的事,又不能脱离企业,闭门造车,必须准确地定位,真正起到引领作用,作企业技术创新的源头。曙光公司和智能中心内部也在不断进行机制改革。只有在有利于自主创新的体制机制中,科技人员的聪明才智才能如泉水一样迸发出来。曙光的历史证明了这一条颠扑不破的真理。