×

注册花火通行证,没有账号立即注册

首页 > 新闻中心 > 评论 > 正文

解读“天河2号”超算五连冠:令人反思的“金牌文化”

2015-08-08 10:54:31来源:网易科技

扫一扫

分享文章到微信

扫一扫

关注花火网微信公众号

收藏

分享到

 易评:“天河2”蝉联5届超算冠军 是骄傲是虚名?

新一期排行结果果然如此前预料——冠军再度易主。半年前由华硕和德国亥姆霍兹中心(GSI Helmholtz Center)联手打造的黑马“L-CSC”,如今被挤到第四位;新的三强则全部来自日本,且均由日本ExaScaler Inc.和PEZY Computing两家公司携手研发。

纵观Green500(以每瓦性能为指标的排行)的“千变万化”,对比Top500(以最高性能为指标的排行)的“万年不变”,这其中其实只说明了一个问题——在今天的超算世界里,市场更关注的是有着更高实用价值的中小型超算系统,而不是只具备象征意义,“买的起但用不起”的巨无霸工程,如我们的“天河2号”。

超算研发难点在于软件和能耗

在继续吐槽之前,小编想要先澄清一些超算研发的难点和挑战。

外行人士通常都会调侃——中国的超算冠军是靠“堆硬件”堆出来的,核心技术都是别人的,就是比别人多用了几块CPU和GPU而已——这种说法从某种角度看——没错!

业内人士对以上说法通常会反驳——超算绝对不是简单的堆砌硬件,团队在超算领域的研究是拥有核心知识产权的,其中一部分甚至是世界领先水平——从某种意义上来说,其实——也没错!

首先,美国人提供的CPU和GPU并不是“买来即用”的。怎么让成千上万个处理器在物理架构层面互联互通,是需要一定技术的。而这个技术的难度有多大?世界上当然只有少数国家掌握,只不过至于其他的大多数国家,譬如非洲的难兄难弟、南美洲的战略伙伴、中东的石油大亨,以及欧洲那些丁点儿大,自身只发展旅游和金融业的福利发达国家……他们似乎也没有迫切发展超算技术的需要或条件。因此,总体说来,其实有此方面发展需要的国家本质上都已经掌握了相关技术(剩下的只是经验问题)。

其次,海量的处理内核“堆砌”在一起,如何充分利用,并有效管理及合理分配系统资源——对Linux内核进行优化,重点在于改进系统资源的分配和调用效率——是一项巨大的软件工程,需要相当的经验累积和编程技巧(也正因为Linux的开源与开放,所以在超算领域形成了绝对的垄断地位)。因而从以上这个角度出发,小编相信“天河2”是先进的——至少能有效利用到3,120,000个内核,并且通过峰值性能证明了自己。

只不过,这最后要提到的一个难点——功耗,已让不少曾经大力发展“万亿次级”超级电脑的国家都暂停了前进脚步。像“天河2”这样功耗高达17,808千瓦的巨无霸,供电问题不仅只是成为了批评者攻击的“槽点”,更是因为这种先天性的缺陷,使得整个系统从实用性方面看就几乎成了一种“摆设”——敢问,除了当初拿来测试峰值性能那段时间,“天河2”有多少时日曾是“马力全开”的?

这里小编来给大家做一个简单的计算和比较,以帮助更好地理解“17,808千瓦”究竟是个什么概念。

中国大陆第一座大型商用核电站——大亚湾核电站,共装配6个发电机组,总装机容量6,120,000千瓦,其中70%为香港供电,30%为广东供电。如果“天河2”全负荷开机,17,808千瓦瞬间没了,也就是供给广东的那部分电力,其中的1%被广州的“一栋楼”给用掉了。2013年全北京市社会用电总量为913亿度(千瓦时),这与三峡发电站全年发电量相当——988亿度,而如果“天河2”马力全开运转一年,17808 X 24 X 365 = 155998080度电,约1.56亿度,北京0.17%的城市用电没了——看起来比重似乎不高,但试想一下过去几年出现的冬夏两季“电荒”,以及0.17%北京用电所能覆盖的人口数量就感受到其可怕了。而这只是广州的“一栋楼”哦。

功耗问题同时也还带来了散热的问题。像“天河2”这种级别的超算系统,往往需要用到几层楼(也就是一整栋建筑)来统一解决供电、散热以及主机房占地等多方面考虑。换用通俗一点的话来说,这些最后其实都是“钱”的问题——“天河2”造价大约1亿美元,而马力不全开,每年仅电费就要人民币约1亿元;而如果马力全开,电费则至少要人民币1.5亿元。以上还未包括其他维护成本哦。

令人反思的“金牌文化”

当然,如果说“天河2”是形象工程,那就肯定过分了。在首次摘得Top500桂冠时,“天河2”是令国人骄傲的。

但是,在连续5次蝉联该榜榜首之后,主流媒体还继续把这一头衔拿出来说事,还继续当作是一种荣耀……这就有点“抱着四大发明不思进取”的感觉了……如今,主流的超算研究方向早已不再是追求极致的Top500排名。至少不是在现有的处理器技术上通过“堆砌”更多硬件,来打造出一台可以荣获“世界第一”,但同时也可以吞噬一座小型核电站的“能源杀手”。

这里我们还可以参照美国能源部在今年初的一些动作。该机构虽然跟IBM和英伟达签了拟在2018年打造全新“百亿亿次级”(Exascale)超级计算机的合同,但同时我们也要注意到——美国能源部其实一共向五家企业(AMD、Cray、IBM、英特尔和英伟达)分别注入了数千万美元的研发投资,目的是通过对处理器技术的革新,来实现划时代的“百亿亿次级”超算系统。

美国政府并不是不可以利用最新英特尔CPU和最新AMD或英伟达GPU打造出一台超越“天河2”的怪物——当前排名第二的“泰坦”超级计算机,是Cray公司于2011年基于美国橡树岭国家实验室“美洲虎”超级计算机升级而成,采用的还是AMD的Opteron系列CPU和英伟达的Tesla系列GPU。这足够落后了吧?试想我们上次在主流媒体上看到Opteron处理器是啥时候?——然而,如果简单地用更多CPU和GPU来打造出超越“天河2”的超算系统,“投资”与“回报”则很可能无法形成正比。这里我们可以对比一下排名第一的“天河2”与排名第二的“泰坦”在性能和功耗两项指标上的具体差别:

“天河2”峰值性能为54,902.4 TFLOP/s,最高性能为33,862.7 TFLOP/s,功耗为17,808千瓦。“泰坦”峰值性能为27,112.5 TFLOP/s,最高性能为17,590.0 TFLOP/s,功耗为8,209千瓦。基本上,“天河2”的各项指标约等于“泰坦”各项指标的两倍,但这里有个非常值得注意的关键词——“约等于”,向上“五入”还是向下“四舍”是有差别的。

简单说,“泰坦”的功耗乘以2要小于“天河2”功耗水平,而后者在功耗超过前者两倍的情况下,性能却低于前者的两倍。也就是说,这种堆砌硬件的性能提升是“非线性”的,达到一定规模后,一加一未必还能等于二。

如果“泰坦”的功耗就已经让经费被大幅缩减的美国能源部难以承受,一个性能虽然更强,但运营成本却陡增的超算系统,显然更是没有实用意义——这种认识其实在过去几年的超算研究领域十分普遍,因而越来越多的企业和政府机构开始关注起Green500排行——一个在单位能耗标准下,提供更高计算性能的排行。而在这样的比较之下,我们也看到了更频繁的超算技术更新与交替。

可较为遗憾的是,翻遍过去几期的Green500排行,前50甲里都从未曾有过“大陆超算系列”的身影。我们号称有世界领先的自主技术,但却在一条不切实际的道路上越走越远。

说到这里,又不得不吐槽一下我们饱受争议的“金牌文化”——从学校教育,到代表国家的体育竞技,我们自小被灌输“只能做最好”的思维模式,什么都要争到第一,否则就没有任何意义——于是,在奥运会上,我们以“金牌榜”来激励国民(欧美大多用奖牌榜),金牌得主回到故乡能享受英雄般待遇,而铜牌得主就……我们没见过某地方政府高调慰问铜牌得主吧?在校园里,我们以“成绩好坏”给学生排名,成绩最好的一批学生会集中到一起享受最好的师资待遇,至于其他成绩一般者……若未来能成大器,那必然是有幸接受到了非我国式传统教育;而今再延伸到超算领域,一个“世界第一”的头衔又是让全国媒体沉浸在骄傲与欢快中……可现实地看待问题,大陆企业若想买套“性价比”高的超级计算机,最后恐还是得绕道台湾才有满足要求的产品。

“五连冠”的成绩并非终点,小编相信最终实现“八连冠”,甚至“十连冠”也不会是梦,毕竟已经没有人在做这个方向了。如果我们还是抱着“世界第一”的虚名不放,则恐怕只会错过更多。

我们都说,“科技是第一生产力”,而中小企业则正是这股生产力的中坚组成。如今在互联网泛滥的时代,工业4.0标准普及的时代,任何研发都不可避免的要用到高性能计算机系统,尤其是大学和科研部门的学术研究(Green500排行中很多都是大学和科研机构拥有的超算系统)。可我们只是拿出了一个“天河2”,只是照顾到了国家级科研中心的需要。我们还有很多中小企业和科研机构,他们并非都有能力为“天河2”买单。

当然,一些人会认为我们既然能打造出“天河2”这样的巨无霸,那么再改造出更小型的超算显然也不会是个问题。对此,小编从未有过怀疑。

不过,对于我们集中全力冲击和占领性能最高峰的战略,小编恐不能完全认同。我们已经连续5次蝉联Top500冠军宝座,但同时也已经连续5次错过了跻身Green500前50强(不要求第一)的机会。我们并不是造不出有资格进入Green500的产品,我们没有这么做,只能说明我们不予重视。这其实又是一种中国式“金牌文化”的体现。

这种文化最终会给超算发展带来什么弊端?小编斗胆做个猜测——凡不是以刷入Top500榜单为目标的超算项目,都难以获得国家最大支持。而为了打造出能代表国家实力的超算系统,我们又会不惜一切代价使其达到性能的最高峰。但与之同时,为了达到这个高峰,我们也必然会失去——失去学会在性能与能耗之间寻找平衡,学会在小型但足够用的超算系统里实现最优化……更重要的是,没有Green500的资格,我们可能还会错失大量国际商业超算市场的机会——而最后,我们又要回到价格战上,又要以低价示人。中国产品何时才能走出这样的怪圈?

为您推荐
苹果电脑mac系统该怎么用?苹果mac系统怎么删除软件 苹果电脑mac系统该怎么用?苹果mac系统怎么删除软件

Mac系统相对于用习惯了Windows的小伙伴们来说并不友好,但是苹果电脑也可以改装Windows系统,那么苹果电脑mac系统该怎么使用?mac系统怎么删除软件?mac系统该怎么用关于桌面程序

chenliying2021-06-03 11:58

加密钱包隐私有多重要?Square对比特币硬件钱包的初步计划是什么 加密钱包隐私有多重要?Square对比特币硬件钱包的初步计划是什么

花火网报道,在迈阿密热闹的 2021 年比特币会议上,国会议员沃伦戴维森与美国参议员辛西娅卢米斯一起坐下来接受现场采访问题。采访转向了隐私,戴维森回应了对加密钱包的评论。加

limengjia2021-06-05 16:06

美的蒸烤料理炉操作方便吗?美的蒸烤料理炉容量有多大 美的蒸烤料理炉操作方便吗?美的蒸烤料理炉容量有多大

花火网报道,美的蒸烤料理炉已于27日在华为商城上架,原售价1999元,参与众测可享1699元优惠价,同时,众测下单还可赠送价值169元烘焙大礼包。美的蒸烤料理炉操作方便吗?美的蒸烤料理

limengjia2021-05-05 13:44

华为P50外观如何?华为P50配置怎么样 华为P50外观如何?华为P50配置怎么样

花火网报道,按照华为往年的惯例,华为手机将会在在上半年3月份发布春季旗舰机型P50系列,但如今来到了五月份,华为P50系列手机依旧没有发布,虽然华为终端CEO余承东表示,即便华为手机

limengjia2021-05-10 09:31

柔宇FlexPai 2屏幕如何?柔宇FlexPai 2智能预览功能怎么样 柔宇FlexPai 2屏幕如何?柔宇FlexPai 2智能预览功能怎么样

花火网报道,柔宇发布了它们最新的折叠屏新品,柔宇FlexPai 2。柔宇FlexPai 2 搭载旗舰四摄模组。从广阔天地到微观世界,柔宇FlexPai 2 旗舰四摄完全可以满足日常的拍摄使用。柔

limengjia2021-06-04 12:55

realme GT Neo售价多少?realme GT Neo配置如何 realme GT Neo售价多少?realme GT Neo配置如何

花火网报道,realme真我手机官方微博宣布了一个好消息,真我GT Neo开售20天,销量超20万台!今年旗舰机发布会尤其多,不少厂商为了加大竞争优势,进行了降价处理。realme GT Neo售价多

limengjia2021-04-29 09:25

以太坊为什么会暴涨?以太坊是如何崛起的 以太坊为什么会暴涨?以太坊是如何崛起的

花火网报道,今日,以太坊突破3300美元,再创历史新高。AssetDash数据显示,以太坊市值排名升至全球资产第18位,目前约为3906.09亿美元,超越了英伟达及万事达卡,美国银行现排名24位。以

limengjia2021-05-06 16:32

区块链技术会被大规模采用吗?区块链技术被大规模采用的关键是什么 区块链技术会被大规模采用吗?区块链技术被大规模采用的关键是什么

花火网报道,公众缺乏对区块链技术和加密货币之间差异的了解和认识是主流采用主流技术的主要障碍。好莱坞和大众媒体仍然将这个行业描述为具有深厚的犯罪元素,并将其与“丝绸之

limengjia2021-05-10 17:09

新款VAIO Z什么时候发售?新款VAIO Z配置如何 新款VAIO Z什么时候发售?新款VAIO Z配置如何

花火网报道,在 MacBook 系列刚刚起步的年代,VAIO 的 Z 系列可谓代表着索尼,甚至整个笔电行业最高的设计水准。作为自家的旗舰机型,Z 系列在设计与用料上毫不含糊。新款VAIO Z什

limengjia2021-04-29 15:07

HyperX起源RGB游戏机械键盘光效如何?HyperX起源RGB游戏机械键盘游戏体验怎么样 HyperX起源RGB游戏机械键盘光效如何?HyperX起源RGB游戏机械键盘游戏体验怎么样

花火网报道,HyperX拥有水轴、火轴、和冰轴三款知名的机械键轴,顺滑的水、炙热的火、冷酷的冰,截然不同的自然元素充分诠释了HyperX Alloy Origins 起源RGB游戏机械键盘的这三款

limengjia2021-05-09 10:09

加载更多新闻
热门资讯
最新更新