中美超级计算机龙头之争:美国暂居上风,中国步步紧逼

分享到:

在最新出炉的《全球500强》(TOP500)超级计算机排行榜中,美国重新赢回超级计算机运算性能的龙头地位,但能够维持多久还有待观察。而中国不仅在高性能系统数量方面持续领先,同时也在竞争最先推出每秒百万兆浮点运算(exaflop;1018)计算机的排名。

最新的TOP500排名让美国暂居上风,但也显示中国在计算机技术方面持续精进。此外,这项最新排行榜发布时间,刚好就在中美两国间的贸易战升温之际——引发两国贸战的部份原因就在于双方对半导体政策的冲突。

从最新的TOP500排行榜还可看出,加速器继续驱动着全世界最强大的计算机系统,特别是英伟达(Nvidia)的图像处理器(GPU)。除了Nvdia以及总部位于日本的加速器制造商Pezy Computing也在此排行榜中崭露头角。

在历经没有任何一台系统挤进前四强的一年后,美国的超级计算机在这次的TOP500排行榜上分别名列第一和第三。美国橡树岭国家实验室(Oak Ridge National Laboratory;ORNL)的“顶点”(Summit)超级计算机系统在Linpack基准检验上测得122.3 petaflops的运算效能,大幅领先之前中国“神威.太湖之光”(Sunway TaihuLight)的93 PFlops。(相关阅读)

美国劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory;LLNL)的Sierra系统,则以71.6 PFlops排名第三。Summit和Sierra都采用IBM Power 9处理器和Nvidia Tesla V100加速器,透过Mellanox Infiniband EDR互连4,300多个节点。

从Linpack的整体基准检验性能来看,美国的超级计算机以38.2%的整体表现,超越中国的29.1%,重登排行首位。就在6个月前,双方的排名位置还刚好相反。

如果采用新的高性能共轭梯度(HPCG)基准检验,测试结果还更加明确。Summit和Sierra系统分别以2.926 PFlops和1.79 PFlops领先在HPCG基准检验的排名。

相形之下,中国的太湖之光排名第六,成绩为0.481 PFlops。中国第二大系统天河2号(Tianhe-2)则以0.038 PFlops排名第49。其他的中国系统使用该基准检验的排名均在100名之后。

Linpack长期以来一直被视为是相对粗糙的原始理论性能测量标准。相形之下,美国田纳西大学教授Jack Dongarra说,HPCG使用的程序代码则测量7种运算指标,“更能强调数据的动态,特别是在许多实际应用中。”

2

中国在全球最强大的超级计算机占有率不断增加(来源:Top500.org)

尽管这次暂时在性能方面小输,但中国目前在TOP500中拥有206台系统,较6个月前的202台系统更多,持续在TOP500超级计算机数量方面领先。而美国这次创历史新低仅有124台超级计算机,较2017年11月时的145台大幅减少。

此外,联想(Lenovo)目前拥有最多台计算机系统(119),这是中国供应商首次在这个项成绩上脱颖而出。慧与科技(Hewlett Packard Enterprise;HPE)原本以122台系统领先,目前则只有79台。其后排名分别是浪潮集团(Inspur)、Cray和中科曙光(Sugon),分别拥有68、56和55套系统。

排名第六的IBM仅列出19台系统,但由于Summit和Sierra超级计算机的采用,使其拥有在Linpack整体性能排名中占19.9%。Cray和联想则分别以16.5%和12%位居其后。

中国竞逐Exaflop目标

Dongarra表示,虽然中国在这次最新的TOP500排行榜表现不如预期,但自2016年以来一直在加速下一阶段的技术进展。预计中国将推出第一套在Linpack基准检验取得exaflop级运算效能的系统,甚至可能比美国更提前一年。

目前,在中国的三支团队正竞相打造约512个节点的相对较小原型系统,每个节点使用不同的架构。根据其开发结果可能决定哪一支团队将获得资金,打造最终的exaflop超级计算机,预计最早可能在2020年。

Dongarra表示,这三项计划由中国服务器供货商中科曙光以及天河、神威超级计算机背后的团队为主导。多家大学院校、研究机构和国家超级计算机中心均参与了这项合作计划。

中科曙光系统用于连接在6D环形网络上的10,000多个节点,每个节点使用与AMD共同开发的x86处理器。预计天河团队将采用同样用于天河2A中的本土Matrix 2000版本,可能再增加基于Arm的处理器或加速器。神威原型则大致上沿用太湖之光的多核心途径。

一年前,美国政府拨款了2.58亿美元,计划在2021年之前推出百万兆级(exascale)的系统。Dongarra表示,中国和美国共同的目标都在于提供一个支持30GFlop/W效能和超过500Gbits的exaflop系统。

在全世界最强大的系统中有越来越多都使用了加速器——在目前TOP500系统中就有110台系统采用加速器,比6个月前统计的101台增加了。Nvidia GPU是迄今最普遍获得采用的协同处理器,出现在其中的96台系统中,其中包括前10大系统中就有5台采用。

TOP500中有7台系统使用了Xeon Phi协同处理器,日本的4台系统则使用相对较新的Pezy加速器。

有趣的是,在另一项测量节能效率最高的“全球前500强超级计算机”(Green 500)排行榜中,前三大系统都采用了Pezy加速器,而前十大的其余系统则使用Nvidia GPU作为加速器。

3

在最新的TOP500超级计算机排名中,Nvidia持续扩张其加速器芯片供应商的领先地位

Dongarra说:“Pezy系统采用液体冷却方式——也就是说,整个系统浸没在液体中[通常是3M的Fluorinert版本],这比透过板载空气或水更具有节能效率。”

Top 500中的大多数系统都使用Xeon CPU作为主处理器。此外,目前有将近一半(247套系统)都使用了10-Gbit/s以太网络作为其互连,在6个月前这一数字为228。

TOP500中采用相对更昂贵的Infiniband作为互连的系统,则从6个月前的163台减少到目前约139台。Omni-Path互连在最新排行榜中则有38台系统,较6个月前的35台略高。

 

了解更多:

访问意法半导体ST MCU中文官网STM32/STM8中文社区

最新的32位Cortex-M单片机STM328位STM8单片机产品信息;

STM32中文资料、 STM32参考设计ST MCU技术培训STM32开发板活动

STM32单片机微信 
继续阅读
自动驾驶芯片领域闯入无人区的国产厂商能否突围?

2020年被视为自动驾驶的关键之年。近日,Waymo在美开放没有安全员的无人驾驶出租车服务,再次引发了市场对于自动驾驶发展的关注。

蔚来自研自动驾驶芯片,意料之外也是情理之中

今年8月,前Momenta研发总监任少卿入职蔚来汽车,任助力副总裁,直接向李斌汇报。与此同时,蔚来还宣布计划进行超过17亿美元的股票增发,其募得资金将用于自动驾驶技术研发。而今天早上,有消息称蔚来计划自主研发自动驾驶计算芯片,将会投入几十亿人民币,尽管该项目还未经过董事会讨论,但是李斌似乎意向明确,并且蔚来已经组建了独立的硬件团队“Smart HW”来负责此项目。

忆阻器类脑芯片与人工智能

现阶段计算与存储分离的“冯·诺依曼”体系在功耗和速率方面已经不能满足人工智能、物联网等新技术的发展需求,存算一体化的类脑计算方案有望解决这一问题,迅速成为研究热点。忆阻器是一种新型微电子基础器件,其电阻可通过外场连续调节且具有非易失性、小尺寸、低能耗、高速和CMOS兼容等优良特性,被认为是快速实现存算一体化计算最具潜力的类突触器件。与此同时,光电子器件和神经元遵从动力学数学同构性,借助这种同构性可用光电子器件模拟神经元行为并实现类脑计算,基于光子器件的类脑芯片正在往更高集成度、更低功耗、更高性能方向发展,

产业弱、人才缺:芯片如何走出“鸡生蛋”悖论?

随着个别国家对全球产业链的粗暴阻截,我们国内芯片产业链技术落后的困境愈加凸显。中国海关的统计数据显示,2019年我国芯片的进口总额高达3040亿美元,进口额排名第一。目前,国内芯片自给率不到30%。

光刻机研发遇“瓶颈”?芯片重压下,美科技离不开中国这三项技术

随着社会的进步,科技技术的发展也越来越迅速。在这个飞速发展的时代中,没有任何一个人甘愿做时代的"抛弃者",每一个人、每一个企业、甚至是每一个国家都在向着更加高端的技术进行攻克和研发,争做时代中的领先者。