1. 简介 ASCAC 百亿亿次计算小组委员会的这份报告旨在涵盖“迈向百亿亿次级”所引发的主要问题,并就追求(以及不追求)这一高性能计算方向所涉及的风险水平提供一些指导。2“迈向百亿亿次级”将意味着计算架构的彻底改变 - 基本上,大大提高并行性水平,达到数百万个处理器协同工作的程度 - 这将迫使硬件设计方式发生根本性变化(至少受功耗的经济限制所驱动),我们解决问题的方式(例如应用程序代码),以及我们如何将应用程序代码与底层硬件(例如编译器、I/O、中间件和相关软件工具)结合起来。要了解进入百亿亿次级计算的优势,并评估走这条路所涉及的风险,既需要评估过去从百万次浮点计算时代过渡到现在千万亿次浮点计算时代的经验,也需要评估高级应用程序是否已准备好利用百亿亿次级计算的变革优势。这些是我们在报告 3 中讨论的问题,与能源部赞助的、高度详细的、以学科为导向的“大挑战研讨会”报告(见附录 2)相比,报告的讨论更为笼统,而我们的许多讨论都是基于该报告。
计算项目(17-SC-20-SC)是美国能源部科学和国家核安全管理局的联合项目,负责提供有能力的Exascale生态系统,包括软件,应用程序和硬件技术,以支持该国的Exascale Compuctive。
1。HPC /天气与气候准备的趋势概述2。< / div>GPU改编,单个精度,I/O,工作流和分布式计算3。可维护性 /性能可移植性4。< / div>附件:提供会员和其他组的幻灯片
摘要:Exascale计算和人工智能的出现提供了巨大的潜力,可以显着提高地球系统的预测能力。但是,必须克服巨大的挑战,以适应模型和预测系统以有效地使用这些新技术。2022年WMO关于EXASCALE计算的报告建议“在努力和关注与不断发展的计算技术相关的中断的努力和关注,这将越来越难以克服,威胁要在天气和气候预测能力方面持续进步。”此外,来自观察,模型和启动输出以及后处理的数据的爆炸性增长有可能使能够及时,准确和精确的决策信息提供能力。人工智能(AI)提供了未开发的机会来改变模型的开发方式,处理观察结果,并分析和提取预测以进行决策。鉴于计算的成本非常高,预测系统的复杂性日益增长以及越来越难以管理的数据生产和消费,这些挑战对于任何单个机构或国家都无法处理的挑战迅速变得太大了。本文描述了关键的技术和预算挑战,确定了解决方案的差距和方法,并提出了许多建议。
图3:Fugaku(Riken -2020)和Frontier(Ornl -2021)是两个最近安装的Exascale超级计算机,这些超级计算机说明了这些系统上硬件多样性的增加,包括处理器,互连,存储和I/O。由于使用GPU(21兆瓦与30兆瓦),Frontier更加有效,但预计将来系统的功耗将继续增加。与处理器和系统体系结构的变化同时
摘要在本文中,我们描述了Alya代码的升级,并在数值过程的每个时间步骤中都可以在压力场计算中实现可靠性,效率和可扩展性,以求解不可压缩的Navier-Stokes方程的大型涡流模拟公式。我们在Alya的内核中开发了一个软件模块,以接口当前版本的PSCToolKit中包含的库,PSCToolKit(稀疏线性系统的迭代解决方案)在并行分布式内存计算机上,由Krylov meths构造,并耦合到代数Multigridigrid promigrid Preponditioners。该工具包在EOCOE-II项目中经历了各种扩展,其主要目标是面对Exascale挑战。在风电场应用中对气流模拟的现实基准测试结果表明,PSCToolKit求解器在Alya内核中可用的可伸缩性和并行效率方面可用的共轭梯度方法的原始版本明显胜过,并且代表了将Alya Code移至Exascale的非常有希望的软件层。
本研究得到了百亿亿次计算项目 (17-SC-20-SC) 的支持,该项目是美国能源部科学办公室和国家核安全局的联合项目,负责提供一个强大的百亿亿次生态系统,包括软件、应用程序和硬件技术,以支持美国百亿亿次计算的需求。这项工作得到了劳伦斯伯克利国家实验室实验室指导研究与开发计划的支持,美国能源部合同编号为 DE-AC02-05CH11231。本研究使用了橡树岭领导计算设施的资源,该设施是美国能源部科学办公室用户设施,由合同 DE-AC05-00OR22725 提供支持,国家能源研究科学计算中心 (NERSC) 是美国能源部科学办公室用户设施,位于劳伦斯伯克利国家实验室,根据合同编号 DE-AC02-05CH11231 运营,使用 NERSC 奖项 ASCR-ERCAP0022112。本工作利用了日本理化学研究所通过 HPCI 系统研究项目(项目编号:ra010013)提供的超级计算机 Fugaku 的计算资源
1 加利福尼亚大学地理系,美国加利福尼亚州伯克利市 2 太平洋西北国家实验室,美国华盛顿州里奇兰市 3 加利福尼亚大学区域地球系统科学与工程联合研究所,美国加利福尼亚州洛杉矶市 4 加州理工学院喷气推进实验室,美国加利福尼亚州帕萨迪纳市
摘要:能源百亿亿次地球系统模型 (E3SM) 项目是由美国能源部 (DOE) 开发的一项正在进行的、最先进的地球系统建模、模拟和预测项目。由于重点支持 DOE 的能源使命,了解和量化该模型模拟水循环过程的效果尤为重要。在这里,我们评估了 E3SM 1.0 版 (v1.0) 表示大气河流 (AR) 的能力,大气河流在水蒸气输送和降水中发挥着重要作用。将标准分辨率 (1 ◦ × 1 ◦ ) 下 E3SM 中与全球 AR 相关的特征和降水与现代时代回顾性研究和应用分析第 2 版 (MERRA2) 进行了比较。 E3SM 中的 AR 频率全球模式与 MERRA2 具有高度相关度(≥ 0.97),且年度、季度和不同集合成员之间的平均绝对误差(MAE;< 1%)较低。然而,存在一些大尺度条件偏差,导致 AR 偏差——其中最显著的是双热带辐合带 (ITCZ)、北半球和南半球冬季更强和/或向赤道方向移动的副热带急流,以及夏季北半球西风增强。通过比较仅大气和完全耦合的模拟,我们将偏差的来源归因于大气成分或耦合响应。使用 Dong 等人揭示的关系。 (2021),我们提供了证据表明,冬季北太平洋急流增强,夏季北半球西风增强,分别与E3SM的双ITCZ和相关的较弱的大西洋经向翻转环流(AMOC)有关,