分享

南方科技大学快速建设世界一流超算系统

 清风细雨hans 2021-04-12

如果是第一次听说南方科技大学(以下简称“南科大”),很可能并不会将其和清华大学、北京大学这样的一流高等学府联系在一起。然而事实是,南科大在中国内陆高校排名第八,数据源于泰晤士高等教育世界大学排名(THE)。

2010年12月,教育部批准南科大正式筹建。2012年4月,教育部正式批准建立南科大,并赋予学校探索具有中国特色的现代大学制度、探索创新人才培养模式的重大使命。2015年正式进入广东省高水平理工科大学建设行列。2018年,南科大成为历史上最快获批国务院学位办新增博士学位授权单位,同时入选广东省高水平大学重点建设高校。南科大至今满打满算才走过8个年头,和这样的荣誉之间似乎不可能划上等号,即便放眼全世界也少有这样的奇迹,南科大却做到了。

南科大凭的是什么?最直观的依据肯定是研究成果,举一个例子,援引THE数据,南科大论文篇均被引次数位列中国内陆高校第一。间接呢?是越来越多教授的加入,越来越多先进研究设备的支撑,二者相得益彰,推动着南科大的进步。

据南方科技大学副校长兼总务长鲁春介绍,2017年的时候南科大还只有近200位教授,而现在是近400位,增长速度惊人。至于先进的研究设备,在最新一期全球TOP 500超算集群中排名第127位的太乙便是最好的证明。事实上,太乙也是除了军工类院校外,国内高校排第一的超算集群。

为什么南科大的教授会增长如此之快?因为待遇?这一点不可否认。不过,同时就像鲁春说的,很多教授回来并不是单纯考虑待遇这样的问题,还会重点考虑有没有支持他们继续做研究的环境、设施。正所谓良将配宝刀。

当然,这一切的背后离不开深圳市政府几乎无条件的资金支持。

日前,笔者有机会走进南科大,参观并聆听了关于太乙的建设、运行及应用情况,收获颇丰。

超算有多重要?

超算近些年成了高频词汇,过去我们提及超算,常关联的场景其实没有那么多,也就是天气预报、海洋环境研究、材料学、宇宙科学研究等。

现在呢?几乎各行各业都离不开超算。比如汽车制造、动画渲染、游戏制作、药品研发、船舶设计、金融分析、现代农业等。由于超算演化出来的基于本真物理、化学原理的直接数值计算,在很多领域就如实验,理论一样,已经成为独立的科学研究工具。

拿南科大为例,学校超过半数的学科研究都会用到超算系统。比如,材料科学、人工智能、生物学、空气动力学、化学等。

南方科技大学副校长兼总务长 鲁春

由此也就不难理解为什么超算被提及的越来越多,甚至重视程度已经上升到了国家层面。说到底,超算关乎每个行业的前景,关乎国家的未来竞争力。

中国超算正在崛起

在这样的大背景下,应该说中国超算近些年取得了长足的进步。可以从两个维度看:

一、数量。以最新公布的全球超级计算机Top 500排行榜为例,虽然美国重新拿下了榜首的位置,但中国上榜超算系统的数量仍然保持快速增长势头,从2018年上半年的206台增加到了227台,占总数的比重增加到45%以上。

其中特别值得一提的是,Top 500榜单中的十大超算系统生产商中有4家为中国企业,且联想以140台的上榜数量再获冠军,在上一期Top 500榜单中,联想的上榜数量为117台。

二、应用情况。众所周知,如果没有应用,超算系统只是一台庞大的计算机,并没有价值,只有有效利用起来,才能为各行各业带来价值,对社会进步贡献力量。而不得不说,应用方面,中国超算走的也很快。

这其中,南科大就是一个典型,系统先进不假,为各个学科带来的帮助也是实实在在的。顺便说一句,太乙采用的也是联想的方案。

下面重点讲讲太乙的运行情况,从中或许能更真切感受到中国超算的进步。

有了太乙,教授们心里踏实了

太乙是南科大建设的二期超算系统,在此之前南科大已经建设了一期系统,叫启明。其中,一期系统是2015年开始建设的,二期是2017年7月启动的,两次间隔时间如此短,也侧面反映了南科大的发展速度。

“太乙”集群采用了英特尔® 至强® 铂金处理器,包含815个双路服务器节点,5.5PB的存储容量,FPGA节点、GPU节点和胖节点,采用风冷技术,PUE在1.5左右。其理论计算性能为每秒2500万亿次,实测计算性能为每秒1687万亿次。

而从开始筹建到最终交付使用,太乙历时近一年,于2018年10月安装完毕,12月18日开始对全校师生开放使用。

好事多磨,尽管太乙的建设花了不少时间,但由于提前沟通充分,方案配置妥当,评审严格,太乙自投入运行以来受到师生广泛好评。一个最直接的体现是,原来需要在外找计算资源的教授们,现在可以用太乙了。这省去教授们很多采购超算资源的时间,也节省了他们的研究经费。

在采访中,鲁春讲到两个细节,值得有同类需求的机构、组织借鉴。一是建设之初,南科大几乎征集了每个学科、每个教授的意见,这保证了每个学科都能有用武之地;二是评选过程严格按需求和按规定流程执行。

得益于精细化的管理和不断改进的作用队列系统,太乙运行情况良好。比如,南科大计划采用内部购买的方式运作太乙,而不是谁想用就想用,想用多少资源就用多少资源。目前,太乙资源利用得当;以后南科大科学与计算中心会进一步帮助用户提高他们编码的计算效率。不过,据鲁春透露,按照南科大的发展速度,可能他们很快就要进行升级了。

为什么又是联想?

南科大三次招标,最终联想获胜。这样的结果意外吗?应该说是情理之中的事。要知道Top500中有140台是联想提供的方案,即便聚焦高校与研究机构领域,目前,全球排名前25位的研究型大学和机构中,也有17家正采用联想的HPC和AI解决方案进行研究。

南科大一隅

所以,如果南科大没选联想,才会觉得出乎意料。联想为什么会成为越来越多客户的超算选择?或者说联想在超算方面究竟有着怎样的实力?不妨从两个维度来看。

一、产品、技术创新层面。

联想做超算是有积淀的。早在2002年,由联想公司研制的深腾1800超级计算机以1.027TFLOPS的测试性能在中国超算的首次榜单中排名第一。随后,联想又相继研发了深腾6800系统、深腾X8800系统,每一代系统的表现都可圈可点。

特别值得一提的是,在这个过程中,联想还收购了IBM x86服务器业务,这一举措也使得联想的超算实力大增。

截至当前,联想超算有很多创新性的技术。最为人们所熟知的,想必是45℃温水水冷技术,联想首创,在北京大学已经得到应用。相比传统的风冷散热技术,采用联想45℃温水水冷技术的北京大学超算系统未名一号,PUE值能控制到1.1。事实上,在采访中,南科大也透露未来可能会采用水冷这样的技术。

显而易见,源源不断的技术创新为联想超算打下了坚实的基础,推动着联想超算事业不断向前。

二、应用实践层面。

如前文所述超算脱离应用就是一堆计算机,没有价值。深知这一点的联想在发展超算的道路上走出了自己独有的一条道路,那就是联想不仅搞底层系统、软件的研究创新,还在应用层面投入了很多资源,比如,近些年联想邀请了众多跨学科的专业人才加盟。

由此也就不难理解为什么联想超算的进步会如此神速?核心就两句话,人无我有,人有我精。

截至当前,联想超算支持着全球160多个国家众多领域的突破性研究,包括癌症、大脑研究、天体物理学、人工智能、气候科学、化学、生物学、汽车和航空等,几乎覆盖各行各业。

总结全文,南科大的应用实践给了我们三点启示:一、中国超算事业发展很快,实力进步很明显;二、超算带来的价值很可观;三,联想是值得信赖的超算合作伙伴。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多