找回密码
 新注册用户
搜索
查看: 8615|回复: 25

[转帖] “神威太湖之光”成为全球最快超算

[复制链接]
发表于 2016-6-21 00:30:40 | 显示全部楼层 |阅读模式
来源新华网6月20日,德国法兰克福国际超算大会(ISC)公布了新一期全球超级计算机TOP500榜单,由国家并行计算机工程技术研究中心研制的“神威·太湖之光”以超第二名近三倍的运算速度夺得第一。更令人振奋的是,该套系统实现了包括处理器在内的所有核心部件全国产化。


shenwei.jpg


据国际TOP500组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。更重要的是,与“天河二号”使用英特尔芯片不一样,“神威太湖之光”使用的是中国自主知识产权的芯片。 “神威太湖之光”由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄。



shenwei1.jpg
世界运算最快是种啥感受?运算一分钟相当于地球人算32年
  系统的峰值性能125.436PFlops,世界第一;
  持续性能93.015PFlops,世界第一;
  性能功耗比6051MFlops/W,还是世界第一。

  国际超算大会上传来的消息光看数据让人不明就里。
  “简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”国家超级计算无锡中心主任杨广文介绍。
shenwei0.jpg
  走进国家超级计算无锡中心,1000平方米的房间内,记者看到了“神威·太湖之光”的“真身”:
  由4个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。
shenwei2.jpg
  “每一块处理器相当于20多台常用笔记本电脑的计算能力,4万多块再组装到一起,速度之快可想而知。”杨广文说。
  全球超算,唯快不破。致力超算研究的意义不仅仅是“速度战”,更重要的是赢得“应用战”。
  国家超级计算无锡中心副主任付昊桓介绍,依托“神威·太湖之光”,以清华大学为主体的科研团队首次实现了百万核规模的全球10公里高分辨率地球系统数值模拟,这一成果将全面提高我国应对极端气候和自然灾害的减灾防灾能力;国家计算流体力学实验室对“天宫一号”返回路径的数值模拟结果令人振奋,将为“天宫一号”顺利回家提供精确预测;上海药物所开展的药物筛选和疾病机理研究,短短2周就完成常规需要10个月的计算,大大加速了白血病、癌症、禽流感等方向的药物设计进度……
shenwei3.jpg
“神威太湖之光”所使用的“申威26010”众核处理器(6月16日摄)。该处理器采用64位自主申威指令系统,峰值性能3.168万亿次每秒,核心工作频率1.5GHz。“神威太湖之光”里安装有40960个这样的处理器。

回复

使用道具 举报

发表于 2016-6-21 00:59:07 | 显示全部楼层
本帖最后由 flybike007. 于 2016-6-21 01:03 编辑

厉害,,用的自主产权的处理器,好奇这个是啥技术,啥时候能民用。。
回复

使用道具 举报

发表于 2016-6-21 02:37:09 | 显示全部楼层
核心和intel的xeon phi仍有很大差距,想想phi用了多少核心就达到3万亿次单精度浮点运算了,而神威的芯片用了240核心才到3万亿次。
回复

使用道具 举报

发表于 2016-6-21 09:08:23 | 显示全部楼层
一柜子龙芯么?
回复

使用道具 举报

发表于 2016-6-21 09:49:15 | 显示全部楼层
这个名字太中二了
回复

使用道具 举报

发表于 2016-6-21 11:03:30 来自手机 | 显示全部楼层
flybike007. 发表于 2016-6-21 00:59
厉害,,用的自主产权的处理器,好奇这个是啥技术,啥时候能民用。。 ...

不是X86 只适合超算  架构比较有新意  应该是未来方向
回复

使用道具 举报

发表于 2016-6-21 11:08:13 | 显示全部楼层
功耗比第一,这感觉不太可能
回复

使用道具 举报

发表于 2016-6-21 11:13:03 来自手机 | 显示全部楼层
本帖最后由 gongyz 于 2016-6-21 11:20 编辑
faner 发表于 2016-6-21 02:37
核心和intel的xeon phi仍有很大差距,想想phi用了多少核心就达到3万亿次单精度浮点运算了,而神威的芯片用 ...


需要100多核  而且phi是单核四线程  这个差距其实不大 而且单芯片就完成了E5+phi的工作 比较有特点
回复

使用道具 举报

发表于 2016-6-21 11:29:40 | 显示全部楼层
看世界超算表格,神威用的核心数是天河II号(E5+Phi)的30倍,但是计算能力只有天河II的3倍,能耗比是天河II的3倍。
回复

使用道具 举报

发表于 2016-6-21 11:44:22 来自手机 | 显示全部楼层
本帖最后由 gongyz 于 2016-6-21 11:45 编辑
kittyjia 发表于 2016-6-21 11:29
看世界超算表格,神威用的核心数是天河II号(E5+Phi)的30倍,但是计算能力只有天河II的3倍,能耗比是天河II ...


你看错了  天河二号核心数超过3M 用K20做加速卡的titan都有56万
回复

使用道具 举报

发表于 2016-6-21 12:33:50 | 显示全部楼层
gongyz 发表于 2016-6-21 11:44
你看错了  天河二号核心数超过3M 用K20做加速卡的titan都有56万

没有30倍,但是有3倍,天河II号3120000核心,神威10649600核心,超算表格有误。不知是否有意为之。能耗比3倍没错。
回复

使用道具 举报

发表于 2016-6-21 13:01:12 来自手机 | 显示全部楼层
kittyjia 发表于 2016-6-21 12:33
没有30倍,但是有3倍,天河II号3120000核心,神威10649600核心,超算表格有误。不知是否有意为之。能耗比 ...

找到一张详细的
92100070bad6c1c51a4.jpg
回复

使用道具 举报

发表于 2016-6-21 13:39:30 | 显示全部楼层
神威?难道只有我想到了卡卡西?
回复

使用道具 举报

发表于 2016-6-21 15:10:33 | 显示全部楼层
nvidia这次挺风光,pcie版本的GP100单精度就有4.x万亿次,超过phi第二代了。
回复

使用道具 举报

发表于 2016-6-21 15:35:42 | 显示全部楼层
本帖最后由 swh@home 于 2016-6-22 19:59 编辑

前几代申威处理器使用的貌似是在当年DEC转让的Alpha指令集架构上修改的自主指令集架构,这一次使用的是众核架构,不知道还有没有联系了。
PS:根据该文章http://www.netlib.org/utk/people ... way-report-2016.pdf,可以确定是没有什么联系了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-20 00:54

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表