2.1 参考应用程序第一个参考应用程序 Nek5000 (C1) [1] 是一个基于谱元法 (SEM) 的流体和传热求解器,具有悠久的开发历史。在 20 世纪 90 年代中期,它是第一个可用于分布式内存计算机的代码,并于 1999 年因算法质量和持续的并行性能而获得了戈登贝尔奖。良好的扩展属性是通过将基于 SEM 的域分解为一系列不相交的谱子域来实现的,这允许将全局算子分解为一组局部执行的密集矩阵-矩阵乘法,并结合通过直接刚度求和的通信步骤。这种域分解也可用于提高模拟的可靠性,因为可以在运行过程中动态修改域分解以最小化估计的计算误差。在 EXCELLERAT 中,KTH 将致力于 Nek5000 的开发,重点关注与 WP4 服务数量相对应的多个方面,例如:使用伴随算法(内在优化方法)进行自适应网格细化、不确定性量化(数值方法、数据缩减算法)、使用加速器(移植到新架构、节点级性能工程)或后处理数据缩减(现场可视化)。它涵盖了从预处理阶段开始的整个模拟周期,其中必须生成相对复杂几何的粗六边形网格(网格划分算法)。在模拟阶段,我们将专注于非一致网格的压力预处理器(数值方法)和通信内核(系统级性能工程)。
为了在高维空间中实现项目的目标,这项工作将利用域分解技术,特别是Pinn-PGD [2],以识别缺失的偏微分方程(PDE)项。此方法可以增加物理模型,从而通过求解修改后的PDE进行后续验证。该方法在源自非线性模型的数据上显示,而假定已知的物理模型是线性的。结果展示了提出的技术如何用非线性术语对线性模型进行补充,以发现原始的非线性公式。所提出的方法可用于表征船只与物理测量的结构建模的偏差,并增强原始材料建模公式。
2.1 参考应用程序 第一个参考应用程序 Nek5000 (C1) [1] 是一个基于谱元法 (SEM) 的流体和传热求解器,具有悠久的开发历史。在 20 世纪 90 年代中期,它是第一个可用于分布式内存计算机的代码,并于 1999 年因算法质量和持续并行性能而获得 Gordon Bell 奖。良好的缩放特性是通过将基于 SEM 的域分解为一组不相交的谱子域来实现的,这允许将全局运算符拆分为一组局部执行的密集矩阵-矩阵乘法,并结合通过直接刚度求和的通信步骤。这种域分解也可用于提高模拟可靠性,因为可以在运行过程中动态修改域分解以最小化估计的计算误差。在 EXCELLERAT 中,KTH 将致力于 Nek5000 的开发,重点关注与 WP4 服务数量相对应的多个方面,例如:使用伴随算法(内在优化方法)进行自适应网格细化、不确定性量化(数值方法、数据缩减算法)、使用加速器(移植到新架构、节点级性能工程)或后处理数据缩减(现场可视化)。它涵盖了从预处理阶段开始的整个模拟周期,其中必须生成相对复杂几何形状的粗六边形网格(网格划分算法)。在模拟阶段,我们将专注于非一致网格的压力预处理器(数值方法)和通信内核(系统级性能工程)。
科学机器学习(SCIML)通过简化计算建模并提供具有成本效益的替代模型,从而显着增强了传统的数值方法。尽管有这些优势,但SCIML代理的训练阶段仍然在计算上仍然昂贵,从而限制了它们在现实世界,多尺度和多物理学,工程问题中的适用性。这个博士学位项目旨在通过为利用多级技术和/或域分解方法开发新颖的培训算法来解决这一局限性。重点将放在设计创新的优化器,调查各种网络分解以及实施有效的并行化策略以提高可扩展性和降低计算成本。
摘要 — 本文研究了人工神经网络 (ANN) 作为基于机器学习算法的替代建模方法在模拟高 Q 压电谐振器和滤波器的电声波行为方面的有效性。本文还讨论了结合 ANN 模型的域分解方法,用于同时分析多域射频 (RF) 模块。本文开发了不同的多层感知器 (MLP) ANN 模型,并根据其模型精度和模型效率进行了基准测试。然后利用开发的模型构建梯形 Band 7 和 Band 41 带通发射滤波器作为示例,以突出建模方法的质量。本文简要讨论了与机器学习算法能力相关的其他可能应用。
主管:本·莫斯利(Ben Moseley)关键字:多尺度模拟,物理知识的神经网络,多GPU计算,多级方法,di =构成方程,科学的机器学习背景科学研究依赖于我们模拟科学现象的能力。从了解生物系统如何与建模宇宙的演变相互作用,模拟使我们能够预测特性,检验假设和探索可能是di = icult的场景,可以通过实验进行研究。我们今天对研究的许多物理系统表现出强烈的多尺度现象。这些系统的特征是它们在多个空间和时间尺度上的复杂相互作用,例如,在全球气候模型中云与大气循环的相互作用,或形成层次暗物质结构。准确地进行多尺度模拟会带来一个重要的挑战,因为它需要可以正确捕获这些相互作用的复杂模型。此外,传统数值模拟的计算成本(例如有限的di =和有限元建模)可能是巨大的,需要为每个仿真使用超级计算机。近年来,科学机器学习的领域已经解决了克服这些挑战的新方法[1]。例如,物理信息的神经网络(PINN)[2,3]是一种使用神经网络进行模拟的方法。与传统的数值方法相比,它们不需要复杂的模拟网格,并且可以轻松地合并观察数据以了解相互作用。但是,使用PINNS开箱即用的是显着的挑战。它们在训练上可能是计算上昂贵的,并且可能难以建模多尺度的互动。我们最近的工作[4,5]表明,Pinns可以通过将它们与域分解和多级建模相结合,从而进行多尺度模拟E =。域分解允许将全局仿真问题分解为较小,易于解决的问题,而多级建模则可以在多尺度交互之间提供更好的通信。
多块结构化网格的分区会影响数值模拟的性能和可扩展性。最佳分区器应同时实现负载平衡和最小化通信时间。最先进的域分解算法在平衡处理器之间的负载方面做得很好。但是,即使工作得到很好的平衡,通信成本也可能不平衡。影响通信成本的两个主要因素是边切割和通信量。当前的分区器主要侧重于减少总通信量,并依赖于简单的技术,例如在最长边处切割,而这种技术不会捕获几何中的连通性。它们也没有考虑网络延迟和带宽对分区的影响,导致所有平台上的分区相同。此外,它们的性能测试大多采用平面 MPI 模型,其中分区对通信的影响被同一节点上内核之间的快速共享内存访问所隐藏。在本文中,我们提出了用于多块结构化网格的新分区算法,以解决当前分区器的上述限制。新算法包括一个成本函数,它不仅考虑了通信量和边切,还考虑了网络的延迟和带宽。我们尽量减少所有处理器之间的总体成本,以创建最佳分区。为了证明所提算法的效率
摘要 - 我们开发一个混合现实平台,以可视化人脑的某些解剖结构和功能区域,并交互作用地计算大脑动脉中的血液流动,特别关注动脉瘤的影响。几何细节和大脑动脉从MRI图像中进行了分割,并且大脑的功能区域被功能性大脑图块鉴定和映射。该平台由带有相机的全息设备组成,以捕获物理对象,并从用户手势以在数字对象上操作,以及基于GPU的平台管理器,以融合全息图设备和计算系统的数据。该平台的另一个主要组成部分是连接到平台管理器的平行计算机,用于使用高度可扩展的域分解算法对大脑流的血液动力学的接近实时计算。这样的平台可能在大脑科学中有许多应用,在本文中,我们专注于它在数字大脑的可视化中的应用,包括某些功能区域的面积,体积和厚度,破裂的风险评估以及对脑动脉瘤的外科手术计划。索引项 - 混合现实可视化,人脑,功能图集,血流动力学,不稳定的不可压缩的Navier-Stokes方程,交互式平行计算
摘要 - 在本文中,我们提出了一个交互式平台,用于可视化和操纵从计算机断层扫描(CT)重建的人心的数字双胞胎。该平台涉及一对全息眼镜,它们的相机用于通过手势输入控制参数,高端图形工作站充当平台管理器,以渲染数据并控制计算的平台经理,以及高性能计算机群集,这是基于物理学的心脏模型所需的重量计算的高性能计算。心脏的数值模型被称为生物心脏的数字双胞胎,使用所提出的平台,我们可以在心脏的某些部分看到并操作生物心脏中很难达到的心脏。这样的平台可以用作外科计划的离线工具,也可以用作操作过程中近乎实时的工具。本文的主要重点是算法和软件,用于通过手势通过全息玻璃操纵三维弹性对象,对表面几何的控制以及对平行计算机上弹性物体的运动和位移的接近实时计算。心脏的变形是由在超级计算机上求解的超弹性方程式建模的,以便几乎实时获得物理上有意义的运动。报告了实际患者的心脏的初步结果。索引术语 - 相互作用的全息图,数字双胞胎,心脏超弹性模型,有限元素,域分解,平行处理
摘要。在Exascale计算时代,具有前所未有的计算能力的机器可用。使这些大规模平行的机器有效地使用了数百万个核心,提出了一个新的挑战。需要多级和多维并行性来满足这种挑战。粗粒分量并发性提供了一个差异的并行性维度,该维度通常使用了通常使用的并行化方法,例如域分解和循环级别的共享内存方法。虽然这些主教化方法是数据并行技术,并且它们分解了数据空间,但组件并发是一种函数并行技术,并且分解了算法MIC空间。并行性的额外维度使我们能够将可扩展性扩展到由已建立的并行化技术设置的限制之外。,当通过添加组件(例如生物地球化学或冰盖模型)增加模型复杂性时,它还提供了一种方法来提高性能(通过使用更多的计算功率)。此外,货币允许每个组件在不同的硬件上运行,从而利用异质硬件配置的使用。在这项工作中,我们研究了组件并发的特征,并在一般文本中分析其行为。分析表明,组件并发构成“并行工作负载”,从而在某些条件下提高了可扩展性。这些通用考虑是