大洼县打印机价格交流组

迎接E级计算,联想整装待发

技术商业观察er2018-10-30 09:11:12

 

   还记得计算机的发展史么?

 

  1946年2月14日,标志现代计算机诞生的ENIAC在费城公诸于世。这个大家伙长50英尺,宽30英尺,占地170平方米,重30吨,有1.88万个电子管,计算速度是每秒5000次加法或400次乘法。ENIAC不仅占地大,而且耗电极大,开机时整个费城西区的电灯都为之黯然失色。至于可靠性…ENIAC每15分钟就可能烧掉一支真空管。

 

  70年过去,如今一个迷你计算器的性能都已经超过了ENIAC,而计算机的巅峰计算力也已经达到了每秒十亿亿次——在第47届全球TOP500超算排行榜中夺冠的“太湖之光”,性能峰值已经达到125.4Pflop/s(每秒12.54亿亿次)。

 

  70年间,计算机的性能翻了不知多少倍,即便如此,人类也未曾停止攀登计算新高峰的脚步。在十亿亿次之后,超级计算机的下一个台阶是“E级计算”,即“百亿亿次”——1后面18个0,想必大家在日常生活中,根本无法触及这样的数字。

 

  “E级计算”也成为HPC厂商们新的愿景。7月1日,联想举办了主题为“开启E级计算新篇章”的2016全球超算峰会,刚刚在全球TOP500超算榜单中斩获份额亚军的联想展现出了更大的胃口,对于目前看似还很遥远的“E级计算”,联想打算要做一个有力的竞争者。

 

  E级计算还需迈过几道坎

 

  在今年6月20日所公布的第47届全球TOP500超算榜单中,联想以92套系统的成绩获得份额亚军,这是历史上中国厂商在TOP500榜单中获得的最好成绩,同时也帮助中国厂商第一次在TOP500中的份额超过美国(中国167套,美国165套)。

 

  获得这样的成绩足够联想骄傲,但对于E级计算这个新的高峰,全球所有的HPC厂商,包括联想,都还有很长的路要走。

 

  E级计算,或者叫做百亿亿次,并不是HPC领域的一个新目标。在HPC计算峰值刚刚突破千万亿次浮点运算的时候,英特尔等厂商就已经提出了百亿亿次的愿景。当时,“摩尔定律”依旧在发挥着作用,异构计算大获成功,“众核”技术刚刚起步。

 

  时间仅仅过去六七年,HPC计算峰值已经从千万亿次突破到十亿亿次,跨越了两个台阶,看上去,百亿亿次已经很近了,近的好像一下子就能触摸到,然而事实并非如此。中国计算机协会高性能计算专业委员会秘书长张云泉先生指出,E级计算还有“几道墙”很难跨越。

 

  “首先是功耗墙”,张云泉表示,如果不采用新的半导体技术、新的加速部件以及新的综合处理器的话,按照现在CPU堆积的方式,E级HPC功耗将达到50-100兆瓦,电费一年就是几个亿,一般的超算中心根本无法承担。

 

  另外两个障碍是“可靠性墙和并行墙”,以太湖之光为例,节点数量超过4万个,处理器数量达到两万多个,核心数量上千万,E级计算可能会有更多的节点和核心,部件多了更加容易出错,同时更大的并行度也更难于管理和扩展。

 

  但E级计算并非遥不可及。张云泉指出,美国、欧盟、日本和中国都有E级计算的计划,但是目前美国是比较悲观的,预测2022年以后才能实现E级系统;而其它的国家都比较乐观,包括中国:“中国太湖之光为我们下一步实现E级计算呈现了一丝曙光,根据推算,大概三到四年左右计算峰值应该会有十倍的增长,E级计算到了2020年应该是比较有希望的。”

 

  联想HPC的“二、三、五”

 

  用“前景是光明的,道路是曲折的”来形容E级计算最恰当不过。这一目标的实现需要HPC整个产业链的共同努力,包括Intel、NVIDIA、Mellanox等上游厂商,自然也包括联想这样的HPC系统厂商。

 

  斩获佳绩之后,联想HPC的道路更加清晰。联想并没有喊出“XX年实现E级计算”的口号,而是规划出了一系列的策略和方向,概括而言,有“两支柱、三方向、五持续”。

 

  据联想集团商用业务企业级解决方案和ISV总监李炜介绍,联想将集中在高性能架构的优化和智能管理两个领域,细分起来有“绿色节能、智能管理、深度学习”三大发展方向,满足和预判联想HPC未来三到五年的技术需求。

 

  在联想2016全球超算峰会上,联想发布了深腾x8800超级计算机解决方案,体现了架构优化和智能管理的理念。硬件架构上,深腾x8800包含了NextScale高密度服务器、刀片系统、机架服务器、GSS高性能存储以及网络设备;更为重要的是包含了联想自主研发的LiCO管理软件,李炜将其比喻为深腾x8800的“中枢和大脑”,是将“宝石和珍珠”串结起来的链条。

 

 
 

  “正是在LiCO的管理内,联想可以给合作伙伴提供从小节点到大节点,到单行计算,所有全家族的服务,保证业务的平稳运行,提供持续可靠的高性能计算支持”,李炜强调。

 

  绿色节能和深度学习也是联想HPC将要重点发展的方向。李炜认为,在“功耗墙”制约下,HPC不得不把节点的数量和单机的功耗限制在一个合理的范围,这样联想所主推的水冷技术将成为业界的主流解决方案;同时,深度学习有着广泛的应用前景,HPC也将大有用武之地。

 

  再具体来说,联想HPC还确定了五大持续投入的方向,包括平台硬件研发投入、自研专用软件LiCO、预投专有实验体系、全球技术专家团队和完善生态体系。

 

  联想HPC优势在哪里?

 

  联想HPC所提的五大持续投入方向,实际上也是联想HPC的优势所在。

 

  在平台硬件上,联想在着力开发水冷技术。据联想集团高性能计算解决方案高级总监LuigiBrochard先生介绍,当前HPC制冷技术有空气制冷,节点风冷、背板水冷热交换,节点内直接水冷三种技术,三者所能实现的PUE不同,最为理想的是节点内直接水冷,能够实现1.1的PUE值,实现最高的能源效率。

 

  节点内直接水冷是联想HPC的努力方向,其优势不仅在于能够实现更高的能源效率,同时还能实现热能回收的最大化。非常特别的,联想采用温水冷却技术,进一步节省了制冷电力。

 

  “采用45度的水制冷,一年可以节省20%的制冷电力。采用50%摄氏度水制冷,通过向建筑物提供能源,可以节省30%的能源,这完全是不可置信的技术——不仅能够省电,还可以降低能耗,这两方面同等重要”,Luigi Brochard表示,联想部署在莱布尼茨的SuperMUC超算就是采用了温水冷却技术,PUE值达到了1.1,五年内电力节省达到了37%。

 

  在新的实验室的建设和设备采购上,联想也有着巨大的投资。目前联想在美国的罗利和德国斯图加特设置了高性能实验室,很快将在北京建设联想全球第三个、中国第一个更大规模的高性能计算实验室。

 

  技术是由人来实现的,在技术人才方面,联想有着经验丰富的全球技术专家团队。据联想集团商用业务企业级解决方案和ISV总监李炜介绍,联想有着原有的中国专家团队以及整合System x之后加盟的世界级专家团队,在行业细分领域,比如在制造领域、能源领域和教育领域,联想有着深厚的行业积累和HPC专家储备。

 

  在生态系统方面,联想将通过去年发布的“Open+”战略来共建HPC生态系统。“其实Open+是联想把整个产业厂商做了一个重新的定位。比如我们把Intel叫做硬件平台提供商,联想叫做系统平台提供商,微软和VMware叫做软件平台提供商,一些独特的软件提供商叫做行业运营提供商,大家一起组成一个四位一体的生态系统,共同开发和完善整个高性能领域的战略”,李炜表示。

 

  E级计算将带来什么?

 

  《三体》中有一个观点,人类科技的发展并不是一个平稳的直线,而是一个爆炸式的速度。回想计算机发展的70年,从ENIAC到太湖之光,计算速度的发展似乎验证了这一论断。E级计算的到来,又将成为计算速度的一座新的丰碑。

 

  那么,我们真的需要这样的计算速度么?E级计算,到底是一个愿望,还是一个必然的需求?它到底有着怎样的现实意义?

 

  对此,联想数据中心业务集团副总裁Brian Connors先生指出,打造E级计算系统本身是一个过程,这个过程其实非常重要,因为它会推动很多HPC组件技术的突飞猛进:“E级计算本身是一个非常大的技术上的目标,在去实现这个目标的过程当中会助推大量技术的一些创新。同时,E级计算系统中构成它的那些小的技术可以单独拿出来,用来构造那些可能更小的、性能没有那么高的系统。”

 

 
联想数据中心业务集团副总裁Brian Connors先生

 

  Brian Connors先生表示,E级计算对于科研很有意义。比如人脑模拟、医药研发,如果E级计算系统能够被大量使用的话,这样的一些科学研究的工作毫无疑问就能够更加轻而易举地进行。另一个方向是商用,比如人类的设计能力可以得到极大的提升,现在用计算机去做一些电脑辅助设计的话成本还是

比较高的,如果以后E级计算实现了将会极大地降低计算成本。

  总而言之,E级计算将给人类带来更多的福祉。

  按照乐观的估计,E级计算将在2020年问世,距现在不过四年时间。届时,人类对计算速度的下一个目标又会是什么呢?

 


Copyright © 大洼县打印机价格交流组@2017