李宗隆:千帆兢渡 百舸争流: 大陆超级计算机的快速发展

选择字号:   本文共阅读 1622 次 更新时间:2018-12-05 00:32

进入专题: 超级计算机  

李宗隆  

摘要:一国超级计算机的水平不仅代表计算机科学与工程技术的前沿,也是其整体工业发展的重要指标。在大陆连续称霸全球五年后,美国最近夺回「超算」世界第一的头衔,我们应如何看待此事?本文深入浅出地介绍「超算」和「超算500强」的相关基本知识,有助读者了解国际超算风起云涌的发展现况,并能看懂「天河二号」和「神威·太湖之光」超算的技术优越处,从而理解我国超算团队的智慧和毅力。最后谈及下一代「E级计算机」的现况,和对台湾同胞的期盼。


引言


超级计算机(Supercomputer,简称「超算」)是指运算速度比一般计算机快千、万或更多倍的计算机。国际超级计算大会(ISC,International Supercomputing Conference)自1993年开始,每半年公布一次世界上最快计算机的前500名,称为「超算500强(TOP500)」。2018年6月最新的超算500强榜单显示,中国过去五年占有的全球第一,被美国最新超算取代了。想了解国际超算的发展现况,得先对「超算」和「超算500强」有些基本认识才有可能。


「超算」及其核心技术


假如我要到位于东、西、南、北方,且各离我5,000米的四家店去买特定物品,我单独一人当然可在某段时间内把任务完成。但如果我有三个助理,我们四人可以同时出发,各跑一家店各买一物,他们再把买到的东西交我。采这方式完成任务的时间,约是前一方法的四分之一。我们四人并没加快脚程,但四人合作让完成任务的速度变快。这种加速完成任务的方法称为「并行处理」或「平行处理」。

并行处理能加速的任务必须满足一个条件:其子任务相互没有依存度,即彼此是独立的。「一人到某家店买东西」和「另个人到另家店买另样东西」两个子任务是独立的,因此可以「并行」。要注意的是:不是所有任务都可「并行」。例如,任务的内容改为:「一人去买西瓜或凤梨」和「前者如买到西瓜,第二人去买西瓜刀;前者如买到凤梨,第二人去买凤梨刀」。这两个子任务相互依存,第二人得等前一人回来后才知道要买啥。这两个子任务彼此不独立,因此不能「并行」。

任务并行化的过程得经过三个阶段。一、管理者把任务分割为子任务,并派工给参与任务人员。二、参与任务人员(管理者和助理)各自执行完成子任务。三、助理将子任务成果交给管理者,管理者整合最后的任务成果,发布最终结果。如果未把任务并行化,第一、三阶段是不必要的。第一、三阶段是把任务并行化所增生的附加管理工作,而且任务管理本身常常不能并行化。因此,这不可避免的任务管理工作是拖慢整体任务的因素之一。

再以前面提到「一人去买西瓜或凤梨」和「另个人去买相应用途水果刀」的两任务为例,如果两人在执行子任务时能彼此通讯,买果人一旦买定某种水果立刻通知买刀人,这两个子任务就不是完全不能并行化了。两人可同时出发前往各自的目的地,如果买刀人先到刀店,就在刀店等买果人的电话。二人买好东西,各自返回时又可达一定程度的并行化。因此,只要允许子任务之间可以通讯,能并行化的工作就增加了许多。

当然,这类型工作的并行化不如「彼此独立」的工作有效率。效率折损的程度由三因素决定。一、等待时间。如果买刀人的脚程比买果人快,他的优势会因等待而变得不显著。二、通讯速度。两人如用手机通讯会比信鸽通讯快很多,买刀人会更快知道要买哪种刀,也可更早启程返回。三、通讯量。如果买果人跟买刀人报告的内容,除了水果种类之外,必须报告水果大小、硬度等资讯,买刀人才知如何买刀,通讯时间越拉长,越不利于并行化的时程。可见等待时间越短、通讯速度越快、通讯量越少,对并行化任务的执行越有利。

如果用计算机术语把上面例子再整理一遍,读者就可了解为何「超算」能算得那么快的原因,以及「超算」要达快速计算所要克服的核心技术。

首先,「超算」所以能快速计算的原因,并不是采用了一个效能强于目前技术可及器件千万倍或以上的处理器(这种处理器当然不存在),而是把计算工作能并行处理的部分并行化,再把子工作派给「许多」处理器的计算核心电路协同计算,达到加速计算的目的。这里的「许多」可能是成千上万,在一些特大型的计算可能是上亿。每个处理器的效能和当时主流处理器的效能其实差不多,但如能让大数量的处理器有效率地协同工作,便能大幅提升总体计算效能。计算机科学家有时也称这类的计算速度提升为「并行计算」或「平行计算」。

其次,一个完整的计算一般可分成数个子计算。如前面例子所提,不是所有任务都可以高效地并行(即便允许子任务间相互通讯)。在不能并行的程序片段,所有其他参与计算的处理器只能处在等待状态,对计算的加速完全使不上劲。即便在可并行的片段,并行化不能避免的任务划分派遣、最后子任务计算结果的集结整合等等的管理工作,也对计算的加速不利。由于这些因素,一部「超算」的实际计算效能永远低于理论效能。

再者,并行计算时,子任务之间的通讯速度和通讯量是影响超算效能的关键因素之一。通讯量主要由计算程序所用的数学方法(演算法)决定,数学家和软体工程师一般已把这个环节最佳化了,计算演算法选定后再以减低通讯量来改进效能的机会就不大了。进一步的效能改进只能依赖增快子任务之间的通讯速度,所以任务之间的通讯速度是超算系统计算速度最关键的因素之一。通讯速度由超算系统所采用的通讯网络速度决定,因此几乎每一部占上全球最快位置的超算,其通讯网络速度在当时常有一定程度的突破。

最后,超算系统任务划分和资料通讯的负荷,会随处理器数目的增加而增加,因而抵消增加处理器数目所获得的计算效能。因此,一部超算能有的处理器数目是有其上限的。这个事实可用阿姆达尔定律(Amdahl's law)描述。如图1,超算的理论加速比(Speed up)对其处理器数目(Number of processors)作图。理论加速比也和程序的可并行化之比率(Parallel portion)有关。以图中代表可并行化比率90%的程序的曲线为例,当处理器数目增加到128时,理论加速比已开始趋缓;当处理器数目超过512时,理论加速比已几乎没变化。所以,一部超算的优越效能绝对不是靠处理器的堆集就可以达到。相反地,一部超算所能容纳的处理器数目是由其「超算系统架构」决定的。超算系统架构是指硬体部件(如处理器、内存、通讯网路等)和软件之高效配置,是超算的核心技术。


图1:超算的理论加速比(Speedup)对其处理器数目(Numberof processors)作图,称为「阿姆达尔定律(Amdahl'slaw)」。


超算是一个技术含量极高的计算体系。为确保各处理器高效地协同运行,高效的处理器、快速的网络、先进的系统架构等都是关键核心技术。任何一部可以占上世界第一的超算,都隐含在全部或部分关键核心技术有一定的突破,进而把人类技术能力的前沿向前推进了一步。


超算500强(TOP500)


国际超级计算大会最新发布的「超算500强」的前10名如图2所示。图中表列的两个速度Rmax和Rpeak分别为超算的实测和理论运算速度(如前所述,Rmax永远比Rpeak小)。衡量Rmax和Rpeak的单位为每秒浮点运算次数(Flop/s),其中Flop为浮点运算(Floating-point operation)的缩写。(浮点运算即浮点数的运算;浮点数是计算机用以表示一个数的方法,类似以科学记号表示的十进位数。)图二所用的单位为TFlop/s,即每秒万亿次浮点运算。「超算500强」是以超算的实测运算速度(Rmax)排名的。

图2:2018年6月全球「500强」超算榜单中的前10名。


最新榜单中,前四名依序为:美国的「顶点(Summit)」、大陆的「神威·太湖之光(Sunway TaihuLight)」、美国的「山脊(Sierra)」、大陆的「天河二号(Tianhe-2A)」;它们的Rmax分别为每秒12.23、9.30、7.16、6.14亿亿次浮点运算(10PFlop/s),任何相邻两名的差距不大。第五名是日本的「人工智慧桥接云基础设施(AI Bridging Cloud Infrastructure, ABCI)」,其Rmax为每秒1.99亿亿次,和第四名的差别就扩大了。第六到第十名分别是瑞士「代思特峰(Piz Daint)」、美国「泰坦(Titan)」、美国「红杉(Sequoia)」、美国「三一(Trinity)」、美国「科里(Cori)」。第十名「科里」的Rmax还有每秒1.40亿亿次,和第五名「ABCI」差不多。所以,前四名超算是一个「梯队」,第五名和之后的若干部超算是下一「梯队」。

能挤进前100名的国家还有:韩国第11;义大利第13;法国第14;英国第20;西班牙第22;德国第23;沙乌地阿拉伯第29;印度第39;加拿大第53;俄罗斯第72;瑞典第92。很明显,拥有前100名超算的国家和「工业发达国家」高度重合,这说明超算在国家工业发展中的重要性。

比较前四名超算的架构,美国「顶点」和「山脊」的架构极相似。大陆的「神威?太湖之光」和「天河二号」则挺不一样的,其间有许多值得国人骄傲的故事。


大陆超级计算机简介


大陆「天河一号(Tianhe-1A)」于2010年11月成为「超算500强」的第一名,是大陆首部取得世界第一的超算。这个成果当然是奠基于过去许多超算系统的科研成果,比如「银河」、「曙光」、「神威」等系列超算。「天河一号」之后,大陆的「天河二号」和「神威?太湖之光」也都曾登上超算世界之峰,下面阐述这两部超算最近的发展及其技术亮点。


1. 「天河二号」


2013年6月,「天河二号」以超过当时美国「泰坦」一倍的实测计算速度(Rmax值)夺得「超算500强」之冠,当时它的Rmax为每秒3.39亿亿次。「天河二号」连续6期(3年)在超算大会上称霸。直到2016年6月,大陆另一部超算「神威?太湖之光」夺冠,「天河二号」退居第二。这个局面在超算大会又保持了4期(2年)之久。2018年6月,美国「顶点」和「山脊」的出现,「天河二号」排名退为第四。「天河二号」是由大陆「国防科技大学」研制,部署在「国家超级计算广州中心」。

「天河二号」超算保持全球一、二名达五年之「久」,这是过去纪录里很少见的。由于超算这领域是极其竞争的,「超算500强」之冠的位子常在一、两期后就被取代。「天河二号」能称霸这么久,主要是因为它一出现就是以倍数计地领先对手;而「天河二号」之前有一段时间,夺冠者仅以数十百分点的量超越对手。

「天河二号」系统采用英特尔(Intel)至强(Xeon)E5处理器、至强Phi加速器、大陆自制的THExpress-2主干拓扑结构网路连接,和麒麟(Kylin)Linux操作系统。网路连接和麒麟操作系统是天河二号的技术亮点。TH Express-2网路连接是天河二号领先世界的关键技术之一。很明显地,「天河二号」的「软肋」是用了美国的处理器及加速器芯片,整个系统估计用了16万片。

「天河二号」在连续两年蝉联全球第一之后,美国商务部于2015年4月9日以天河超算「据信用于核爆炸活动」为由,对大陆四个与天河系列超算有关的国家机构限售至强芯片,包括「国家超级计算长沙中心」、「国家超级计算广州中心」、「国家超级计算天津中心」、「国防科技大学」。这个限售是帝国主义行径,因为美国将超算用于核武器研发早为公开事实。例如,目前全球第三名的「山脊」超算,配置在美国加州的劳伦斯?利弗摩尔国家实验室(Lawrence Libermore National Laboratory, LLNL)就是为核武器模拟而设计的。美国限售芯片的理由,只是对中国的欲加之罪。其实仅在发出限售令几个月前,2014年11月美国能源部就已宣布旨在夺回世界第一的「顶点」超算的部件厂商团队。美国的目标很明显:「为确保美国地位,必须不择手段扼杀大陆发展」。

超级计算机芯片由于长时间高负荷工作,每隔一段时间就如消耗品一样须更换。因此,美国的限售确实对「天河」系列超算的正常运行造成很大影响。但四个被点名的国家机构、中国工业和信息化部,以及参与制造天河系列超算的中国浪潮集团,并未立刻对美国限售做出回应。这事件媒体报导得沸沸扬扬,但「国防科大内部非常平静」。「天河二号」团队在限售令发布十天后才首次回应,主任设计师卢宇彤在「中国计算机协会青年计算机科技论坛」表示:「没事不惹事,事来了也不怕事」。「天河」在选择技术路线时就进行过充分的风险评估,也对各种状况制定了相应的预案和部署。天河二号升级目标肯定能实现,时间也在可控范围内。

果然,2017年底「天河二号」团队使用国防科大自主研发的Matrix 2000加速器,取代原有近十万片美国禁售的英特尔至强Phi加速器,并进一步升级高速互联网络、内存和存储。今年6月的「超算500强」显示,这个升级使「天河二号」的Rmax从每秒3.39亿亿次几乎倍增到6.14亿亿次,而能耗只增加不到4%。做为一部五年「高龄」的超算,「天河二号」的表现是超群的。

「天河二号」强大的计算能力与英特尔处理器的高性能密切相关,但也离不开国防科大原创的超算体系结构、高速互联网络系统、操作系统、容错技术、节能创新等的核心技术。在美国恶意限售之后,大陆更致力于自主技术的研发,减少了对美国软硬件和相关标准的使用。


2. 「神威·太湖之光」


美国商务部的限售令显然无法阻饶大陆超算的发展。为了因应限售令,除了前面提到「天河二号」全面采用自主研发加速器,取代原有英特尔产品进行升级之外,还有一件非常值得国人骄傲的事:在限售令后约一年,大陆「神威·太湖之光」超算横空出世,不但取代「天河二号」成为全球之冠,而且采用大陆自主研发的处理器及关键部件。

「神威·太湖之光」以每秒9.30亿亿次的实测运算速度(Rmax)于2016年6月夺得全球「超算500强」桂冠,其核心技术全是大陆自主研发的,包括处理器。「神威·太湖之光」与同为大陆组建的「天河二号」超算连续四度(两年)蝉联「超算500强」的第一和第二名,直到2018年6月被美国「顶点」超算超越。「神威·太湖之光」是由大陆「国家并行计算机工程技术研究中心」研制,目前部署在江苏省「国家超级计算无锡中心」,由大陆清华大学负责营运。

「神威·太湖之光」使用的处理器是「国家高性能集成电路上海设计中心」研发的「申威SW26010」众核处理器。该众核处理器采用64位元自主「申威指令系统」,每个处理器上有260个计算核心(这是该处理器型号「SW26010」中「260」的意思)。整个超算系统共用了40,960个SW26010处理器,共有超过一千万个核心。大陆掌握「申威SW26010」处理器从「申威64指令系统」到处理器设计制造所有知识产权。「神威·太湖之光」采用的神威睿思操作系统(Sunway RaiseOS 2.0.5)以Linux开源代码为基础开发,已有十余年发展历史,主要面向通用、高性能计算领域。该通用操作系统的主要优势在于自主可控度高和安全领域强等方面。神威团队也为「神威·太湖之光」超算用户,开发了基于申威指令的神威睿思编译器及其工具链,形成完备的国产自主指令系统技术体系。很确定地说,大陆「神威?太湖之光」的设计建构从最开始就把核心技术、知识产权牢牢地掌握在自己手上。先前美国对「天河」的恶意禁售,对「神威·太湖之光」起不了任何作用。

「神威·太湖之光」是大陆第一部采用自主处理器并占上世界之巅的超算,它的技术和也是采用自主处理器的「神威蓝光」超算有密切关系。(「神威蓝光」超算使用前一代申威处理器「申威SW1600」。)「神威·太湖之光」能在美国限售令发布后一年多就横空出世,并不是偶然的,而是长期持续技术研发积累的成果。

大陆半导体制程技术还处于追赶西方或其他技术先进地区的状况。「申威SW26010」处理器是以28奈米半导体制程技术制造的,落后英特尔现在的主流处理器所采用的14奈米技术数代。一般而言,采用较落后的制程技术所制造的处理器,计算效能较差且较耗电。那么为何采用「申威SW26010」处理器的「神威·太湖之光」超算还能在世界上夺冠?因为「神威」团队在处理器和超算的架构上的创新,克服了部分因为制程技术落后所造成的局限。虽然还是有部分局限──如每个处理器的内存太少(只有32G)──是绕不开的「物理」制约。但总体而言,「神威」团队的这些创新堪称经典之作。

大陆计算机工业发展起步较晚,在国际舞台上常受制于人,美国2015年对「天河」超算机构限售就是一个例子。大陆超算团队在对手重重封锁、阻碍之下,一关一关地突围。做为超算领域的后来居上者,大陆的非凡成就归因于超算科学家的优越技术实力,和在风险评估及相应预案步步为营的谨慎部署。


大陆超算的发展


图3列举1993到2018年各国入围超算500强的计算机数目,此图有助我们了解过去15年的大陆超算发展。大陆超算在最近几年不仅有了夺冠的实力,就数量上也有井喷式的发展。表1列举近三年大陆和美国入围500强的超算数目:2015年之前美国入围500强超算数量远超过大陆;2016到2017上半年,两方的超算数大致相同;2017下半年之后,大陆已经超过美国,而且差距有加大的趋势。

图3:1993到2018年世界各国入围超算500强的计算机数目,大陆超算最近几年不仅拥有夺冠实力,数量上也有井喷式的发展。(图表中色块所代表的国家的次序与图中右边代表国家次序一致,由上而下分别为中国大陆、南韩、义大利...等,以此类推。)

表1:2015到2018年中国大陆和美国进入全球「500强」超算数目。2016年是一个转折点:之前,美国遥遥领先大陆;之后,大陆开始超前,且幅度有加大的趋势。


一国入围500强超算的数量,可当做反映国家「整体实力」的指标。2016年是中美整体实力开始逆转的关键时间点,之后大陆就开始领先了。我国超算还要认真发展、谨慎布局,才能固化这个逆转。

图4是2018年6月的统计,各超算制造商所造的系统入围500强的数量及其占比。大陆的「联想(Lenovo)」、「浪潮(Inspur)」、「曙光(Sugon)」、「华为(Huawei)」占比分别为23%、13%、11%、3%。特别值得注意的是,「联想」不只成为全球占比最高的厂家,也是第一个把超算系统大量卖给各国的超算制造商(卖本国20套、美国21套、其他各国总和23套)。

图4:2018年6月统计,各超算制造商所造的超算入围500强的数量及其占比。其中「联想(Lenovo)」、「浪潮(Inspur)」、「曙光(Sugon)」、「华为(Huawei)」均为大陆公司。


2001年大陆上榜500强的超算数量还是零,但今天已有夺冠实力,整体实力引领世界,并且已具有出口超算的商业竞争力。地球上没有其他国家有这么快的增长速度。二、三十年前,超算系统尽是美、日的天下。久而久之,很容易让年轻人或一般民众误以为中国在高端科技是永远落后的。现在大陆计算机科学家和工程师不仅建构出世界一流的超算,也建构了国人的自豪感和自信心。


大陆超算之应用


由于计算机的普及与发达,人类解决问题的手段,除原有的理论和实验方法,多了一个崭新的方式:计算。任何一个科学、技术、社会、商业等各方面的问题,只要能用数学模型有效描述,就能以计算方法解决该问题到某种程度。要用这种计算模拟手段解决问题,当然须把问题转为可演算的数学模型,再在一部计算机上执行计算,最后获得结果。随着问题复杂度或所涉范围的增加,所需的计算资源越大,对计算速度的要求也更严苛。比如天气预报,如果模拟一天气候变化所需的计算时间超过一天,它就不算是「预报」了。像这样大型高速的计算,只有超算才能胜任。超算是近代科技与生活不可或缺的设施。

必须使用超算才能解决的问题很多。例如,汽车、飞机、飞船等在空气中高速运动时所受的影响,除把依比率缩小的模型拿到风洞吹,还可以用超算依空气动力学的原理模拟。又如,可控核聚变反应室里,用以控制超高温等离子体的磁场设计及最佳化,以及聚变反应本身的模拟都用得上超算。再如,分子和晶体的结构、性质等也可用超算模拟,超算给新颖材料、药品设计、分子生物等领域提供崭新的工具。

戈登贝尔奖(Gordon Bell Prize)设立于1987年,主要是颁给超算应用领域最杰出的成就,是国际超算应用界的最高奖项。该奖通常是由在当时500强中名列前茅超算上运行的应用获得。近30年来,该奖一直由美、日两国垄断。

2016年11月,中国科学院软件研究所研究员杨超等人以「千万核可扩展大气动力学隐式模型」研究获得戈登贝尔奖。这是大陆研究团队首次获得这个超算应用领域的最高奖项。次年11月,大陆清华大学地球系统科学系副教授傅昊桓以「非线性地震模拟」研究再度获得戈登贝尔奖。这个研究首次实现了1976年唐山大地震(7.8级)发生过程的高分辨率精确模拟,让科学家更精准了解该地震所造成的影响。这两个应用的模拟都是在「神威?太湖之光」超算上实践的。

大陆能够突破美、日「戈登贝尔奖」的垄断,除该两个研究团队的优异才华之外,很重要的另一因素是,大陆有自主且名列前茅的超算系统「神威?太湖之光」。此中意义有二:一、有自主的超算,执行自主应用程序的可能性大增;二、有名列前茅的超算所隐含的意义不仅是有一套高效计算工具,更重要的是一群优秀的超算人才。该两件得奖的超算应用要在超算上高效地运行,一群优秀超算人才的技术支持是关键。所以,大陆在「戈登贝尔奖」的突破,也代表我国超算及工业整体水平的提升。

超级计算机是为解决科学或其他问题的计算需求而建置的工具,因此在超算上运行的应用和超算同等重要。应用的发展一般和超算系统的建置,会有一段或短或长的时间差。超算应用人才和超算系统人才的培育是同样迫切的。超算已经是近代科技与文明不可或缺的工具,一个国家超算发展的能力,和其科学工业甚至文明程度息息相关。虽然起步较晚,大陆已经逐渐累积了超算应用的人材培育和创新经验,未来的发展值得我们拭目以待。


台湾的超算


台湾目前只有一套超算登上500强。2017年「高速网路与计算中心」从日本富士通购买「台湾杉(Taiwania)」超算,它没有任何部件是台湾自主的。2017年11月刚购入时,该超算位居「500强」的第95名,半年后的2018年6月掉到第148名。没有自主升级能力者所设置的超算,名次常是这般迅速滑落。「台湾杉」是目前排名第五的日本「ABCI」超算的简化、缩小版。

大陆已经用自主技术造出世界最快的超算,并且对各国输出可进入「500强」的超算。但台湾还是宁可向日本购买,却不肯向对岸同胞购买超算。这跟目前台湾政府「去中国化」的目的与行径不无关联。「抛弃自家无尽藏,沿门托钵效贫儿」。这诗句讲的不就是舍弃自家的技术宝山,却去乞讨他人二流技术的台湾吗?


大陆下一代超算的研制


现在世界最快的两部超算,美国「顶点」和大陆「神威?太湖之光」的实测速度分别已达每秒12.23和9.30亿亿次。目前全球超算强国都把目光放在下一代超算─「E级计算机」的研发。(E 是Exascale 的缩写,代表10的18次方。)「E级计算机」的速度最少要达每秒「百亿亿」次(EFlop/s)以上,故也称为「百亿亿级计算机」。这个计算速度最少约是现有最快超算的10倍以上。为达这个速度,芯片、高速网络、超算架构、及能耗管控等都有一定的技术门槛得跨过,总体技术含量很高。因此,下一代的超算和现在这代有基本上的差异,将是非常不一样的机器,被公认为「超算界下一顶皇冠」。

大陆、美国、日本都宣布了「百亿亿次」超算的研制计画,但真正的竞争者应只有中、美二国,日本已显得有些力不从心。2018年4月美国能源部宣布,在2021-2023年开发至少两部E级超算。大陆在2016年启动三个「E级计算机原型系统」专案,引入「神威」(国家并行计算机工程技术研究中心)、「天河」(国防科技大学)、「曙光」(曙光公司)等三个团队相互竞争。这三个单位所采用的超算系统架构不同,各有特色,在超算领域都拥有深厚的技术积累和丰富的研制经验。

一部新顶尖超算的研制必须投入巨大人力和财力,大陆E级计算机研制计画分两期以减低风险。第一期为「关键技术」研究,第二期将具体研制E级计算机。国防科技大学的「天河三号E级原型机系统」已于2018年7月22日通过项目课题验收,并在「国家超算中心天津」完成研制部署,其速度预计可达「天河二号」10倍以上。两周后(8月5日)「神威E级超算原型机」由「国家并行计算机工程技术研究中心」联合「国家超算中心济南」等团队,经两年多的技术攻关,也已完成研制部署。这表示大陆的E级计算机很快将进入实质研发阶段。从「原型」机到建置完成的E级超算预计还要两年。大陆E级超算原型机没有一部使用美国芯片,全部采用有自主知识产权的芯片和操作系统。大陆下一代超算不止进入「全国产」世代,也将是一个「千帆兢渡,百舸争流」的局面,我们且翘首以待。


结语


人类为了探索自然和对美好生活的追求,衍生出对计算机计算能力永无止境的需求。我们可以预期,超算效能的开发以及国际间的技术竞争将永不停息。一套顶级超算系统的开发和建置,需要的时间周期往往是好几年,因此各国都有自己的超算发展地图和战略目标。但因为超算强国顶级超算的发展周期可能错开,以致中、美超算将进入交替领先的时代。大陆超算第一的取得和被取代将是经常性的事件,不须要过分强调。

由于超算和半导体工业起步较晚,大陆超算之路面对的挑战和应对策略遂不同于其他超算强国。目前大陆超算设施还在普及中,学术及工商界对超算服务的需求还未广泛地满足,大陆超算发展在世界前沿创新的同时,还要照顾到超算应用的推广和普及。另外,大陆半导体制程技术和较先进国家还有代差,要有更多如「神威?太湖之光」的架构创新,才能在超算前沿迎战对手。在发展超算的路上,中国人要有长期奋战的准备。

中国近代的科学技术发展,常受到帝国主义的封锁与阻碍。近十多年来的超算发展,只是众多例子中的一个。大陆从一无所有,到不只一次地造出世界第一的超算,到逆转入围超算500强的系统数目,并开始大幅超越美国,再到成为超算系统的出口国。大陆超算科学家建构的不仅是世界一流的超算,也是令国人骄傲的自豪感和自信心。他们一路走来,凭借的是中华民族优越的智慧和毅力。台湾同胞应该认清:没有民族的自豪感和自信心,小如超算系统、大到台湾社会出路,都要受制于人,永远成不了堂堂正正的中国人。


    进入专题: 超级计算机  

本文责编:limei
发信站:爱思想(https://www.aisixiang.com)
栏目: 爱思想综合 > 学术活动信息
本文链接:https://www.aisixiang.com/data/113793.html
文章来源:本文转自《远望》(2018年09月号;总360期),转载请注明原始出处,并遵守该处的版权规定。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2023 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统