TOP500组织今天公布了第38届全球超级计算机的五百强排行榜Word文件下载.docx
- 文档编号:21760878
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:22
- 大小:1.10MB
TOP500组织今天公布了第38届全球超级计算机的五百强排行榜Word文件下载.docx
《TOP500组织今天公布了第38届全球超级计算机的五百强排行榜Word文件下载.docx》由会员分享,可在线阅读,更多相关《TOP500组织今天公布了第38届全球超级计算机的五百强排行榜Word文件下载.docx(22页珍藏版)》请在冰豆网上搜索。
与其它最近发布的超级计算机不同,K计算机没有使用图形处理器或者其它加速器。
但是,它使用的是这个排行榜中最强大的和最节能的系统。
根据行业通行的Linpack标准,“京”的平均运算速度是其峰值速度的大约93%。
6月份时,它曾以每秒8162万亿次的运算速度排名世界第一。
但是恐怕“京”的冠军宝座也坐不了多久,在这个竞争几乎白热化的领域,这是一贯的游戏规则。
美国IBM公司和Cray公司目前正在为美国能源部进行2万万亿次超级计算机的研制工作,预计将于明年完成。
这台超级计算机将安装在神户的日本理化学研究所(RIKEN)。
当建造完成时,这台超级计算机的运行速度将达每秒10千万亿次浮点运算。
富士通此次并未给出京的耗电量水平数据,但是根据它在今年6月份达到每秒1000万亿次运算水平的时候,其实测功率约为9.89兆瓦,也就是大约每年989万美元的用电费用。
中国“天河一号A”屈居亚军
中国的“天河一号A”依然位列亚军,性能上完全不变,最大性能只有“京”的24.4%。
事实上,除了一路狂奔的“京”之外,从第二名到到第十一名都没有丝毫变化。
这种沉寂在高性能计算历史上实属罕见,TOP500总编辑ErichStrohmaier也表示:
“自从1993年我们第一次发布(超算)排行榜以来,这是第一次前十名纹丝不动。
”
天河一号A其实就这这一排排的机柜
从官方公布的资料来看,“天河一号”在结构上包括了的硬件系统包括计算阵列、加速阵列、服务阵列,以及互连通信子系统、I/O存储子系统和监控诊断子系统等。
而在具体参数上,这款超算计算阵列有2560个计算结点,每个计算结点集成2个IntelCPU,配32GB内存;
服务阵列配备了512个服务结点,每个服务结点含2个IntelEPCPU、32GB内存;
加速阵列使用了2560个加速结点,每个加速结点含2个AMDGPU、2GB显存。
中国“天河一号A”
而除此之外,“天河一号”采用两级InfinibandQDR互,单个通信链路的通信带宽为40Gbps、延迟1.2μs的互联通信子系统,磁盘容量1PB的I/O存储子系统,另外其好配备有采用分布式集中管理结构,实现全系统的实时安全监测、系统控制和调试诊断等功能的监控系统。
除了硬件之外,作为一款超级计算机,没有软件系统的支撑其很难发挥自身的潜力,因此“天河一号”也配备了功能完善的软件系统。
“天河一号”的软件系统包括操作系统、编译系统、资源管理系统和并行程序开发环境等四部分组成。
操作系统:
操作系统采用64位Linux,面向高性能并行计算、支持能耗管理、虚拟化和安全隔离等进行了针对性设计。
编译系统:
支持C、C++、Fortran77/90/95、Java语言,支持OpenMP、MPI并行编程,提供异构协同编程框架,高效发挥CPU和GPU的协同计算能力。
资源管理:
提供全系统资源统一视图,实现多策略资源分配与作业调度,有效提高资源利用率和系统吞吐率并行程序开发环境并行程序开发环境提供一体化图形用户界面,支持应用程序的调试和性能分析。
在“天河一号”的身上,我们可以找到不少的兴奋点,不仅仅是高达千万亿次的峰值运算性能,更有CPU+GPU的异构设计,近年来,GPU得到了高速的发展,其适合于并行数值计算的特性使得高性能计算领域对其一直看好,而在此基础上发展起来的GPGPU(General-purposecomputingongraphicsprocessingunits)更是由于强大的并行处理能力和可编程流水线使得其在面对单指令流多数据流(SIMD)且数据处理的运算量远大于数据调度和传输的需要时能够取得远超传统CPU的性能,这一点在“天河一号”上就体现的非常明显。
2009中国超算排行榜TOP10
从上面的配置图中我们可以看到,“天河一号”的加速系统使用了2560块AMDRadeonHD4870X2显卡,5120颗运行在575MHz的RV770GPU,每颗GPU拥有1GBGDDR5内存。
575Mhz下的4870X2理论双精度浮点能力为0.575*2*800/5*2=368Gflops,2560片能提供942.08TF的理论双精度运算能力,而根据官方提供的46.7%的系统效率以及563100.00Gflops的Linpack值,我们不难得出“天河一号”的理论运算值为563100.00/0.467≈1205781.58Gflops,这也基本就是官方公布的系统峰值,两者相除我们不难看出GPU在整个系统中提供了78%的运算能力。
而剩下的5120颗至强E5540与1024颗至强E5450所提供的理论运算能力仅为2.53*4*4*5120+3.0*4*4*1024=255680.96Gflops。
GPU强大的并行运算能力从这里可以看的一清二楚,而这一点也完全可以从GPU与CPU的对比中看得非常清楚,CPU由于架构的原因以往一直都通过提升制程工艺和主频上来下手,但这迟早会遇到壁垒,而于此同时GPU却的性能以每年2.8倍的速度增长。
而在CPU与GPU的性能比较方面,如果说CPU一条单车道公路,一次只能走一辆车的话,GPU就是拥有多个车道的高速公路,正式大量并行的结构使得其在浮点运算方面拥有了非常块的速度,而在GPU基础上发展起来的GPGPU(通用图形处理器)很好地继承了这一优点,其具有比CPU高一个数量级的浮点性能,因此在注重运算速度高性能领域被格外看好。
世界超算前十名排行榜名称及运行速度(千万亿次/秒)
下面我们来关注一下世界超级计算机前十名的名称及运行速度,日本“京”和中国的“天河一号”上面有提到,这里就不赘述了。
1日本“京”10.51
2中国“天河一号”2.57
3美国“美洲豹”1.759
Cray美洲豹超级计算机
CrayXT5-HEOpteronSixCore2.6GHz内核数224162个,实测运算速度1759000GFLOPS,理论峰值运算速度2331000GFLOPS,Cray美洲豹隶属于美国能源部,坐落于美国橡树岭国家实验室。
说到橡树岭国家实验室,作为“曼哈顿计划”的一部分,(曼哈顿计划就是美国于1942年利用核裂变反应研制原子弹的计划。
曼哈顿计划成功实施后为美国留下了巨大的财富——洛斯阿拉莫斯国家实验室和橡树岭国家实验室)最近的项目是将建设核能创新中心。
说到橡树岭国家实验室,作为“曼哈顿计划”的一部分,(曼哈顿计划就是美国于1942年利用核裂变反应研制原子弹的计划。
橡树岭国家实验室
美国能源部于5月28日宣布,为激励创新和实现清洁能源突破,由橡树岭国家实验室领导的团队将获得1.22亿美元的支持,目的是在五年内建立和运营一座核能建模与仿真能源创新中心。
该中心的人员将来自大学、产业界和其他国家实验室,将利用世界上性能最先进、功能最强大的美洲豹超级计算机,推动核反应堆在设计和工程方面的重大飞跃。
我们怎样才能对全球气候变化有更为准确的把握?
可以看一看当今用于监控大气环境的一些先进仪器。
在从美国联邦政府经济刺激计划中获得1990万美元的升级经费以后,“美洲豹”XT5系统的运算速度最终达到1.759千万亿次,一举成为当今世界上最快的超级计算机。
这台世界上最快的超级计算机致力于解决可能拯救世界的科学难题——气候变化、可再生能源等,而不是用以提升核武器的性能。
“美洲豹”XT5系统由美国国家科学基金会出资、Cray公司建造,田纳西大学和国家计算科学研究院共同拥有。
美洲豹的科学应用
在已经披露过的美洲豹超级计算机的科学应用中,上图从左到右从上到下依次为:
1:
极端气候模拟。
2:
超新星研究。
3:
生命和半衰期。
4:
从光合作用到新燃料
5:
聚变加速
6:
模仿火山爆发应激气候
橡树岭国家实验室负责科学技术的副主任汤姆斯·
撒迦利亚(ThomasZacharia)表示:
“这表明科学确实极为重要,尤其是在解决我们当前面临的最大一些挑战时,重要性更加凸显。
‘美洲豹’XT5系统正处于先进的气候变化科学和能源技术政策的交界处。
4中国“星云”1.271
星云的核心部件采用了曙光公司自主研发的最新一代刀片服务器曙光TC3600,是全球第一款同时支持HPCSC(中国电子工业标准化协会-高性能计算机标准工作委员会)并兼容SSI国际开放性标准的刀片服务器系统,实现了我国刀片服务器产品的标准化。
“星云”系统还应用了曙光自主研发的QDRIfiniband高速交换模块(HSSM)、大规模系统管理和调度系统(Gridview)、高性能计算机安全系统(NiKey)等多项领先技术,使曙光“星云”成为中国自主可控高性能计算机系统。
曙光“星云”是中国第一台面向未来“云计算”环境设计的超级计算机系统,强调系统的均衡设计和资源动态调度能力,将成为我国新一代超级云计算中心建设的主力机种。
。
“星云”系统实测峰值达每秒1271万亿次(每秒执行1271万亿条指令),使其成为亚洲和中国第一台、世界第三台实测性能超千万亿次的超级计算机。
国内外典型超算对比
星云采用了自主设计的HPP体系结构、高效异构协同计算技术,高效易用的编程环境,极大方便用户操作应用。
采用全冗余设计,无单一故障点,在对系统Linpack(国际标准的超级计算机测试方法)测试中,“星云”表现出它的极高稳定性和可靠性。
在对单柜测试得出,“星云”单柜峰值高达25.7TFlops,成为国内同类系统单位面积计算峰值最高的计算机。
每瓦能耗实测性能超过4.98亿次,成为目前是国内最绿色的超级计算机。
5日本“燕子2.0”1.192
燕子2.0(Tsubame2.0)
该电脑位于日本东经工业大学,速度比日本原先最快的、由日本原子能机构所有的超级电脑快12倍。
主要提供给日本大学研究和小部分独立用户使用,该电脑同时运行微软和Linux软件,运行速度达每秒1.2千万亿次。
6美国“Cielo”1.110
Cielo在西班牙语中是“天空”的意思,为洛斯阿拉莫斯国家实验室、桑迪亚和利弗莫尔三个国家实验室提供计算支持。
美国“Cielo”
洛斯阿拉莫斯国家实验室
Cielo超级计算机参数
Cielo超级计算机采用Cray公司的Baker架构,基于AMDOpteron八核处理器,默认主频为2.4GHz计算节点方面采用双子星相互连接。
7美国“昴星团”1.088
昴星Pleiades超级计算机
Pleiades超级计算机由SGI公司基于英特尔至强打造,由4核Harpertown3.0Ghz和6核Westmere2.93Ghz构成,网络连接架构是infiniband方式。
内核数为81920个,理论运算峰值速度973291GFLOPS,实测运算速度772700GFLOPS。
(TOP500运算速度排名世界第6)
NASA总部航拍图
8美国“Hopper”1.054
哈博(Hopper)
该电脑是以美国海军女少将格蕾丝·
哈博(GraceHopper)的名字命名,她也是软件及编程语言的先驱者。
这台电脑位于美国国家能源研究科学计算中心(NERSC),运行速度达到每秒1.05千万亿次。
9法国“Tera-100”1.050
法国Tera100
Tera100系统的理论峰值性能为1.25Petaflops,Linpack性能约为1Petaflop左右,超过了目前欧洲性能最高的JUGENE系统。
JUGENE系统由IBM公司采用蓝色基因/P方案研制,峰值性能为1Petaflop,Linpack性能为0.825Petaflops,安装在德国于利希研究中心。
Tera100于2010年3月完成安装,5月26日正式加电启动。
整台系统由4300个bullxS系列服务器组成。
系统使用了140000颗IntelXeon7500处理核心,内部存储器容量为300TB,外部存储器容量为20PB,全局文件系统的吞吐量为500GB/s。
Tera100将被用于法国核武器模拟项目,以确保核威慑武器的安全可靠。
>
10美国“走鹃”1.042
其实“走鹃”和“美洲豹”都归美国能源部所有,但它们的用途不同。
“美洲豹”XT5是“开放科学”工具,用于涉及广泛主题的同行评审研究,而“走鹃”系统则完全用于对美国核武器进行复杂而秘密的评估。
IBM走鹃超级计算机
同样隶属于美国能源部的洛斯阿拉莫斯国家实验室。
该实验室以研制了世界上第一颗原子弹而闻名于世。
这里部署了另一台赫赫有名的超级计算机,IBM走鹃超级计算机(BladeCenterQS22/LS21Cluster,PowerXCell8i3.2Ghz/OpteronDC1.8GHz,内和数122400个)。
其实“走鹃”也是一种IBM系统计算机,每秒运算速度可达1042万亿次。
它采用了一系列专门针对游戏和商业的技术,包括用于索尼“游戏站3”的九核Cell处理器和AMD双核皓龙处理器。
因此,“走鹃”是全球第一台采用Cell处理器的混合式超级计算机。
“走鹃”系统主要用于对美国核武器进行复杂而秘密的评估。
走鹃
“走鹃”采用了一系列专门针对游戏和商业的技术,包括用于PlayStation3游戏机的Cell宽带引擎和AMDx86处理器。
“走鹃”拥有130536个计算核心,包括12960颗Cell引擎的116640个PPE和SPE核心,以及6948颗双核AMDOpteron处理器。
“走鹃”是全球第一台采用Cell处理器的混合式超级计算机,但也因此需要三种不同的编程工具,以确保不同核心同时高效率运行。
除此之外,“走鹃”拥有80TB内存、57英里光纤、3456个Tri-Blade节点,每个节点由两台BladeCenterQS22刀片式服务器和一台LS21刀片式服务器组成,分别配置4颗Cell和2颗Opteron,两种处理器使用PCI-E电缆连接在一起。
“走鹃”占用了288个IBMBladeCentre机架,总占地面积约为6000平方英尺。
IBM主管下一代计算机系统技术的副总裁比吉安·
迪瓦里(BijanDivari)表示,“走鹃”的构造方式与人脑类似。
走鹃的科学应用
在已经披露过的走鹃超级计算机的科学应用中,走鹃的科学应用主要为:
纳米技术。
核聚变、激光技术。
磁重联技术
艾滋病毒
暗物质
铜反应
7:
流体动力学
“走鹃”是全球第一台运算速度达到petaflop级别的超级计算机。
美国国家核安全管理局局长汤姆斯·
阿戈斯蒂诺(ThomasAgostino)表示:
“如果全世界60亿人每天24小时、每周7天执行纯手工计算,那么需要46年时间才能完成‘走鹃’一天的工作量。
”迪瓦里预计,比“走鹃”强大十倍的超级计算机将于10年内出现,从而使环境模拟可以实时完成
2011TOP500超算新榜单的一些变化:
2011年11月TOP500排行榜前十名
第500名的性能从半年前的39.1TFlops升至50.9TFlops。
今年的最后一名半年前可排第305。
所有系统总性能从一年前的43.7PFlops、半年前的58.7PFlops增加到74.2PFlops。
中国超算数量74台,排名第二,然后是日本30台、英国27台、法国23台、德国20台。
使用GPU加速的超算从17台增至39台,其中35台使用NVIDIATesla计算卡、2台使用Cell处理器、2台使用AMDRadeon显卡。
使用六核心及以上处理器的系统已经占据62%的份额。
Intel处理器份额以76.8%高居第一,总计384台。
AMDOpteron目前占据63台,也减少了3台。
IBM处理器稳定在49台。
千兆以太网是最流行的内部互联技术,占据223台但比去年少了7台。
InfiniBand系统从208台增至213台。
从性能上看,InfiniBand系统的性能几乎是千兆以太网系统的两倍多,分别为28.7PFlops、14.2PFlops。
29台超算的功耗超过了1000千瓦。
“京”的功耗是最高的,12659.9千瓦,不过因为性能更彪悍,能耗比其实是最高的之一,达到了830MFlops/W。
能耗比最高的是蓝色基因/Q,2029MFlops/W。
所有系统平均能耗比282MFlops/W,比半年前、一年前提高了13.7%、28.8%。
前十名平均功耗45.6千瓦,比半年前增加了2.6千瓦,而能耗比维持464MFlops/W不变。
之前榜单排名对比图
2010年6月TOP500排行榜前十名
“国际TOP500组织”每半年更新一次排行榜。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- TOP500 组织 今天 公布 38 全球 超级 计算机 五百 排行榜