网络词典
网络地图
  IT公社 网络广告 IT论坛
网格工场:网络梦工厂
北京  天津  大连  沈阳  长春  唐山  太原  包头  郑州  洛阳  西安  济南  烟台  青岛  长沙  哈尔滨
上海  南京  宁波  苏州  杭州  无锡  常州  南宁  南昌  温州  扬州  湖州  潮州  徐州  香港  石家庄
广州  深圳  佛山  贵阳  泉州  福州  厦门  汕头  珠海  海口  昆明  成都  合肥  重庆  武汉  秦皇岛
网格工场:网络梦工厂


高性能运算的发展趋势和千万亿次计算机简介

http://www.GridTeam.com   2008年10月5日 网格工场  
     演讲人:IBM公司大中华区网格总监朱明

主题:当前世界高性能运算的发展趋势和千万亿次计算机简介

大家可能知道97年对于我们来说是一个大事,1997年的时候香港回归。97年对于高性能计算也是一个大事,1997年的时候世界上第一个TFlops出现,2008年的时候PFLops出现。千万亿次计算,美国可以做出来,为什么可以做出来。我们先谈一下千万亿次的计算,我听到5月26日已经测完了,6月9日的时候这个机器正式投产,大家可以看到有18个CU,第一个到第二个CU,从59TF到116TF。这个机器是18个CU。这个机器是全球第一台配置Cell处理器的混合式超级计算机,需要三种不同的编程工具。80TB内存,576英里光纤,3456个Tri-Blade节点,Roadrunner的电力消耗大约为300万瓦特。

这是我在网上下载的一张照片,这不是我们的机器。这个机器到底用的什么芯片呢,当初我们规划是用这个芯片,Cell的65纳米的芯片。我们另外做了一个芯片叫做Enhanced Cell。这个芯片是一个专用芯片,这个芯片跟其他的芯片比起来,比较小。因为是专用的,只要为高性能计算服务就可以了。这么小的芯片里面,有八个APU,98%以上的计算由APU完成的。大家看到每一个图,实际上都有四颗CPU,我们真正加上去的话,我们叫做加速器,这个Cell的芯片,主要是一个特殊的芯片,用来做加速用的,我们每个这样的东西,我们叫做什么呢,叫做计算节点。每一个计算节点所组成的部分,就是四个Cell的芯片跟四个AMD的芯片,有几个结算节点呢,首先计算节点作为一个加速器,跟AMD的芯片怎么连接,IBM专门为这个项目,做了一个特殊的设计,我们叫做Tri-blade,上面的QS22有两个Cell,我们专门做了这个芯片,这个卡是做一个转换,确实解决了一个高性能计算的问题,怎么样把AMD的和PCIE的口连接起来。我们看到180个计算节点,我这个机器由18个CU组合起来的。我们测到18个CU的时候,有1036个PF。1个CU在Top排名15个,9个CU就可以排到第一了。大家看到BG/L的设计点是一个PF,下一代是蓝色基因Q的设计是10个PF。BG/L是410TF,1.7MW。BG/P是1PF。

下面介绍一下美国的科研结构,它为什么可以建这么大的机器,它的钱哪里来的,我发现美国的科研结构,事实上跟中国有很大的差别,美国科研结构,左边这边是出钱的人,金主,NSF,DoE,DoD,NASA。这里大家可以看到有好多的所有者,国家是所有者,是能源部,可是出钱的人是不同的,出钱人跟管理人、所有人是三种不一样的。所以整个运营单位所有人和出钱人是不一样的,美国到底有多少预算来买高性能计算呢,我发现美国高性能计算这个钱非常少。2009年美国的国防预算515个billion,国防部才12billion,能源部只有6个billion。来买机器的钱只是7%。其他的都是做建设、做机房的做软件的开发。真正花在IT的钱是很少的。从另外一个乐观的角度来讲,我们很多的钱还没有让它花到。

在2001年建设全美最大的国家网络,有四个超算中心合在一起的。每个高性能计算各有它的职责,有负责应用的,后来又加了一个,它把它的国家网格像TACC,比如说跟学校合作,例如像我们的国家网格跟中国的教育部整个合作在一起,把整个国家的科研的规划能够做得更完整,更好。TACC钱从四个地方来,国家给的,能源部给他钱,国防部也给他钱,出钱的是不同的单位,管理的是学校,所以所有者、出钱者,还有管理者是不一样的。它的国家科学基金,把所有的投资分成三个部分。最底下的是自己出,学校也是自己出,学校的超级计算可以申请钱,可是钱不多,大部分的钱是用来买五年之内的所用的。他们是产、官、学三个合作。产就是像IBM,惠普等等。官就是NSF、DoE,DoD,NASA。学是学校。三个方面加起来对高性能计算有很好的帮助。日本,就是产官学协同作战。日本不但投资买机器,还有做研发,把研发的经费提供给各家企业和学校,这样的方法来合作。它的计算中心在新竹。台湾政府的产官学护送船队模式,帮助产业跟学校往前走。

美国高性能计算遭遇的困难,网络虽快,但是应用无法利用。过多的细节我不说了。

对于我们国家来说,有这样一句话,冷静观察、稳住阵脚、沉着应付、韬光养晦,善于藏拙,决不当头。

所以紧跟着科技的脚步,永不出头。

最后总结一下,紧跟新科技的脚步,不要出头。各个超算中心充分合作,或许是各位领导可以考虑的。我们希望作为一个产业,可以希望参与合作。我们要共创双赢。还有硬件非常贵,我们要交给民间。下一代编程模式与算法是风险也是机遇。

Google

网格应用提升企业效率

PKI建设的八大原则 网格计算:全世界计算机联合起来!
商用网格将沿Linux之路发展 数字证书、安全协议、PKI 分布式网络化研究中心及应用

网格计算的现状和挑战

走下神坛的真实网格

网格计算开发入门基本概念

网格计算与分布式超级计算

网格与公用计算中的自动化 

网格---未来的Internet应用

什么是p2p --P2P启蒙 数字证书(CA)基本概念 利用Public Key实现ssh的认证