互联网那些事

互联网那些事

公告

有态度 够深度

统计

今日访问:1639

总访问量:14177020

全球超算TOP 500强出炉:中国再夺总榜第一!

2022年11月18日

评论数(0)

如果说光刻机是人类工业文明皇冠上的明珠,那神威·太湖之光毫无疑问就是我国超算行业的皇冠,曾凭借霸道的算力优势一举夺得全球超算四连冠,近年来,伴随着美国前沿(Frontier)和日本富岳(Fugaku)的异军突起,一度令众网友好奇,神威的E级超算新品为何迟迟未能问世?

神威·太湖之光沉默了?

北京时间11月15日,第60期全球超级计算机TOP 500强榜单重磅出炉,排名第一的是来自美国橡树岭国家实验室的Frontier前沿超算,它凭1.102EFIop/s(百亿亿次)的HPL得分傲视群雄 ,理论峰值性能是第二名Fugaku富岳超算的3倍多。

来自中国的太湖之光和天河二号位列第7、第10名

曾几何时,神威·太湖之光在全球超算圈可以说是风光无两,自2016年面世后,便创造过一连串辉煌篇章:

它是世界第一台峰值运算性能超过每秒10亿亿次浮点运算能力的超级计算机;

2016年,神威·太湖之光轻松斩获TOP 500世界第一;

2016年,神威·太湖之光荣获戈登贝尔奖;

2017年,神威·太湖之光再获TOP 500世界第一;

2017年,神威·太湖之光再获戈登贝尔奖;

如果用通俗的比喻来理解创造四连冠的神威·太湖之光的算力的话,那就是,它运算1分钟,相当于全球72亿人不间断运算32年!

彼时神威·太湖之光的计算性能、持续性能和性能功能比三项关键指标均处于世界前列。

从今年的榜单来看,Frontier的稳定速度是榜单上排名第二的Fugaku的2.49倍,理论速度快了3.14倍,单以稳定速度来看,Frontier是榜单上TOP 2~8的性能之和,在如此彪悍的算力性能下,它的功耗却仅有Fugaku的71%。

仅看数据的对比,神威·太湖之光确实与冠军的成绩有差距,但很多网友没搞明白的一点时,神威·太湖之光是2016年的产物,已经过去6年了,而富岳和前沿呢?

2019年12月13日,富岳首批6台计算机顺利抵达神户理化学研究所计算科学研究中心,由此可见其研制时间在2019年前后,2020年6月,当期公布的全球超算TOP 500榜单中,富岳排名第一;

而在2022年5月30日和11月分别公布的全球超算TOP 500榜单中,均斩获冠军的前沿,其最早的研制时间也刚好在2019年,也就是说,我国的神威·太湖之光投入运行3年后,这些后来者才着手研发新一代超算。

Frontier单排机柜内部

隔着3年的时差,6个代际的排名,但即便如此,我们的超算总体成绩仍然令人瞩目。

就拿这届TOP 500榜单的前十来说,我国的神威·太湖之光和银河2号仍然都进了前十,并且总上榜台数达到162,实力超越了欧美,也就是说,我们实际上仍然获得了总榜第一的好成绩。

即便PK算力,我们也是世界前列。

超算对于大国的意义巨大!

HPE(Frontier运营商)执行副总裁、高性能计算和人工智能部门总经理Justin Hotard曾表示,前沿在速度和性能方面取得了突破,让我们有机会解答那些以前甚至都不知道要问的问题。

美国橡树岭国家实验室相关负责人Jeff Nichols表示,来自世界各地的科学家和工程师都将利用该套系统(指Frontier)非凡的计算速度,来解决我们这个时代全人类最具挑战性的一些问题。

神威·太湖之光的典型应用场景有药物的分子动力学模拟、3D渲染、数字水池和大气动力学等,比如天气预报、雾霾预警、3D大片、新型材料和新型药物的研发等,也就是说,这些超算们的应用场景会涉及到国防、军事、医疗、高能物理、工程设计、地震预测、气象观测、航天技术、国家高精尖科研的方方面面,无论实际需求还是长远意义都很重大。

这也是各大国不遗余力搞超算军备竞赛的真相!

我国超算,们早就拥有了设计一流芯片的能力。

我国的科研人员也早就想到了硬件上的限制,为了不被美国卡脖子,当初超算项目立项之际,就刻意避开了X86\ARM\Risc-V\MIPS四大主流芯片架构,转而选择了有点冷门却系出名门的Alpha 21364架构,基于Alpha开发拓展出了一套有自主知识产权的指令集,也就是后来的申威指令集。

2006年,国家超算无锡中心(江南所)设计出自主微结构的申威1,基于130nm制程工艺,单核心CPU,主频只有900MHz,集成了5700万晶体管;

2008年,江南所推出了申威2,基于130nm工艺,双核心CPU ,主频抬升到1.4GHz;

2010年,申威1600横空出世,基于65nm工艺,但是性能与功耗却超越了当时的Intel,i7 980xe 6核心功耗130W,申威1600功耗仅70W,申威1600在1.1GHz的主频率时,双精度浮点运算能力达140.8G,而i7 980xe 6核心运行在3.2GHz频率时,双精度浮点只有107.55G;

2016年,神威·太湖之光用的申威26010,双浮点峰值已达3.06TFIops,与Intel的Kight Landing处在同一水平,申威26010用落后英特尔和AMD几乎2整代的工艺却做出了不低于后两者的性能,足见当初选择Alpha 21364架构的明智与后续自研拓展指令集的优势。

如今,制程工艺上,限制较明显,但可以选择在功耗控制和堆核心上下力气,花更多的精力,利用与代工厂深度合作的主频优化、自研架构&指令集方面的优势缩短硬件性能差距。

回到了前文的问题,这几年,神威和天河们发展得怎样了?

早在2018年节点,我国已经正式布署了神威、天河和曙光三种不同技术路线的E级超算(跟Frontier同水平线的百亿亿次/秒),其中天河3号原型机更是在当年7月就通过了验收,同年8月5日,神威E级超算也顺利通过了科技部专家组的验收,同年10月24日,来自经济日报的一篇报道显示,神威E级原型机、天河三号E级原型机和曙光E级原型机系统全部完成交付。

这说明什么?说明我们早已掌握了E级超算的相关技术链啊。

2022年4月,中国科学技术大学、国家海洋科学与技术试点实验室 、北京大学数学科学学院、无锡国家超级计算中心和中国海洋大学组成的联合团队,公布了一篇超算模拟复杂量子多体的文章。

据该文描述,在介绍高性能计算环境时提及了申威26010 Pro的架构,该CPU为申威26010的升级改进款,拥有6个计算组,每个计算群有1个管理核心和64个计算核心,较之于仅有4个计算组的申威26010,单片性能至少提升50%,文章称呼为新一代神威超级计算机,似乎也印证着该台超算大概率即为神威·海洋之光。

11月15~17日,第24届中国国际高新技术成果交易会在深圳召开,深流微智能科技有限公司CTO Jerry在演讲中直言“深流微作为国内唯一自研高能性图形渲染GPU的厂商,拥有完全自主知识产权的GPU架构与微架构设计,其自研的XTS系列GPU可广泛应用于AI计算、虚拟现实和元宇宙等领域”。

随着我国算力网络的进一步布局,超算的应用前景将会更加广阔,除了国家队主导的超算之外,民企的算力中心发展速度也十分为惊人,据《河北日报》消息,阿里云于8月30日正式启动了张北超级智算中心,总算力高达逆天的12EFlops,一举超过了9 EFlops的谷歌和1.8 EFlops的特斯拉,有了这样的算力做保障,AI大模型训红、自动驾驶、空间地理等人工智能探索都将如鱼得水。

……

美国有Intel、AMD、高通等一众芯片民企巨头,我们也有华为、阿里、深流微等自主研发高手!

加油~





参考资料:

“神威·太湖之光”荣获四次世界超级计算机冠军——无锡新传媒网

第60期全球超级计算机排行榜TOP 500榜单出炉——IT之家

全球超算TOP500强出炉!弃考一年,中国超算数量仍遥遥领先——新智元

太湖之光是怎么造出来的?——maomaobear

余鹏鲲:美国首台E级超算,赢在哪里?输在哪里?——观察者网

深流微智能CTO Jerry:国产GPU必将迎来难得的机遇,从而实现技术突破——新浪财经

基于AMD的Frontier系统问鼎全球超级计算机TOP 500榜单——至顶头条

图源网


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+互联网那些事。