超分辨率(SR)生成对抗网络(GAN)有望在大型模拟(LES)中湍流闭合,因为它们能够准确地从低分辨率领域重建高分辨率数据。当前的模型培训和推理策略对于大规模的,分布式计算而不足以成熟,这是由于计算需求以及对SR-GAN的训练通常不稳定的,这限制了改进的模型结构,培训策略和损失功能定义的探索。将SR-GAN集成到LES求解器中进行推理耦合模拟也是评估其后验精度,稳定性和成本的必要条件。我们研究了SR-GAN训练和推理耦合LES的并行化策略,重点是计算性能和重建精度。我们研究了混合CPU – GPU节点体系结构的分布式数据并行培训策略,以及低/高分辨率子盒大小,全局批处理大小和歧视器准确性的相关影响。准确的预测需要相对于Kolmogorov长度尺度足够大的训练子箱。应注意训练批量规模,学习率,培训子箱数量和歧视者的学习能力的耦合效果。我们引入了一个数据并行SR-GAN培训和推理库,以进行异质体系结构,该架构可以在运行时在LES求解器和SR-GAN推理之间进行交换。我们研究了这种布置的预测准确性和计算性能,特别关注精确的SR重建所需的重叠(Halo)大小。同样,有效推理耦合LES的后验并行缩放受SR子域的大小,GPU利用率和重建精度的限制。基于这些发现,我们建立了指南和最佳实践,以优化SR-GAN湍流模型训练和推理耦合LES计算的资源利用率和并行加速,同时保持预测精度。
主要关键词