1) 实现低流量高效液冷 为了提高性能,富岳的 CPU 数量是 K 计算机的四倍。此外,CPU 本身的性能也得到了提高,每个 CPU 产生的热量也更大。因此,每个机架的发热量约为 K 计算机的六倍,需要提高冷却性能。通常,通过增加冷却水的流量来改善冷却。然而,这需要更大直径的管道,并阻碍了高密度安装,这是最初的目标。因此,实现低流量高效液冷是一个问题。 2) 在有限的工作空间内进行现场维护 在富岳,CMU 的维护需要现场维护,即在系统本身继续运行时进行的维护工作。然而,CMU 有许多连接,例如用于高速信号、液冷管道和电源的连接,这些连接必须在安装期间插入和移除。
Marc Lesko,Whisper Aero 的 CNC 机械师。图片来源:Carlos Jones/ORNL,美国能源部 2024 年 1 月,这家成立 3 年的初创公司的员工搬进了新总部,将布满灰尘的房间翻新成 21 世纪的航空航天技术设施,其中设有研发原型、测试、制造和运输区域。在曾经矗立着大型印刷机的旧印刷车间,一条 140 英尺长的风洞的脱节部分现在等待重新组装。一家明尼苏达州的自行车公司将这座风洞捐赠给了田纳西理工大学,该大学现在拥有这栋建筑,并将其改造成一个先进的移动业务孵化器,将 130,000 平方英尺的空间中的 40,000 平方英尺租给了 Whisper Aero。这家初创公司的推进创新是一种先进的电动涵道风扇 (EDF),旨在取代大多数飞机上使用的传统化石燃料燃烧发动机。与当今最高效的喷气发动机相比,目前的 EDF 可在 200 至 400 节的速度下将推进效率提高至少 5% 至 10%。Whisper Aero 声称,其专利设计提供了超越当前最先进 EDF 的关键突破,即叶片数量非常多的风扇,其叶片通过频率被推入人类听觉无法听到的超声波范围内。根据该公司的测试,其 EDF 至少安静 100 倍,并且效率提高了 20%
K计算机及其后继超级计算机“ Fugaku”是世界一流的超级计算机,它们是由88,192和158,976个相互联系的节点组成的大规模平行计算机。通过富士通开发的互连技术使这种100k节点的可伸缩性成为可能。技术的分区和虚拟圆环功能可以防止多个并行程序之间的通信干扰和支持每个并行程序中通信模式的优化,以确保稳定的通信性能,并允许分区即使在tain tain失败的节点上也可以使用以获得高可用性。本文介绍了K计算机和超级计算机Fugaku中使用的高维度的互连技术。
AI 技术的发展对于实现日本科技政策中宣布的“Society 5.0”不可或缺。随着这种发展的进行,AI 学习所需的计算资源不断增加。通过 K 计算机和超级计算机 Fugaku(以下简称 Fugaku)的开发,富士通一直提供具有丰富计算资源的高性能计算 (HPC) 系统。现在,为了利用 HPC 系统丰富的计算资源进行 AI 学习,我们正在与 RIKEN 合作在 Fugaku 上开发 AI 基础设施。本文介绍了我们与 RIKEN 联合在 Fugaku 上测试和评估 AI 相关软件性能的当前状态以及我们未来在 HPC 和 AI 方面的工作。
量子计算的经典模拟对于验证量子设备和评估量子算法至关重要。我们提出了在Sunway Taihulight超级计算机上开发的新量子电路模拟器。与其他模拟器相比,本文以两个方面进行区分。首先,我们的模拟器更加通用。模拟器由三个相互独立的部分组成,以使用不同方法计算量子状态的完整,部分和单个幅度。它具有模拟噪声效果并支持更多类型的量子操作的功能。第二,我们的模拟器具有很高的效率。模拟器以两级平行结构进行设计,该结构可在分布式的多核Sunway Taihulight Supercupter上有效实现。随机量子电路可以分别在完整,部分和单个振幅上分别使用40、75和200个QUAT模拟。作为模拟器的说明性应用,我们提出了一个量子快速泊松求解器和用于评估先验函数的量子算法的算法。我们的模拟器有望在各个领域开发量子算法中具有更广泛的应用。
2018 年,桑迪亚国家实验室对建筑环境可持续性的承诺得到了认可,当时阿尔伯克基校区获得了 LEED v. 4 校园认证。该认证是一种更灵活、基于性能的方法,要求在整个建筑生命周期中通过可持续发展努力取得可衡量的成果。桑迪亚国家实验室是第一个获得该地位的 DOE 实验室,巩固了其作为可持续实验室实践先驱的地位,并为其他 DOE 机构树立了标杆。随着实验室的不断发展,其对创新和可持续性的承诺无疑将在应对未来的复杂挑战中发挥关键作用。
摘要TPUV4(张量处理单元)是Google的机器学习培训的第三个生成加速器,用自定义的3D圆环互连部署为4096节点超级计算机。在本文中,我们描述了我们设计和操作软件基础架构的经验,该软件基础架构允许TPUV4超级计算机大规模运行,包括自动故障弹性和硬件恢复的功能。我们采用软件定型网络(SDN)方法来管理TPUV4的高频带芯片间互连(ICI)Fab-fab-fab-fab-ric,使用光电路切换到动态配置围绕机器,chip和链接故障的操作路线。我们的基础架构检测故障,并自动触发对构造的结果,以最大程度地减少运行工作负载的破坏,并为受影响的组件启动修复和维修工作流。与硬件和软件的维护和升级工作流相似的技术接口。我们的动态重新配置方法使我们的TPUV4超级计算机可以实现99.98%的系统可用性,优雅地处理约1%的培训工作经历的硬件中断。
性能因使用,配置和其他因素而异。在www.intel.com/performanceIndex上了解更多信息。性能结果基于配置中显示的日期的测试,并且可能无法反映所有公开可用的更新。有关配置详细信息,请参见备份。没有绝对安全的产品或组件。您的成本和结果可能会有所不同。英特尔不控制或审核第三方数据。您应该咨询其他来源以评估准确性。您的成本和结果可能会有所不同。Intel Technologies可能需要启用硬件,软件或服务激活。©Intel Corporation。英特尔,英特尔徽标和其他英特尔商标是英特尔公司或其子公司的商标。其他名称和品牌可能被称为他人的财产。052021/rjmj/rl/pdf请回收347108-001US
摘要。本文介绍了库尔恰托夫研究所“Cognimed”资源中心获取的 MRI/fMRI 断层扫描数据的自动处理和分析系统的计算机模型。该系统基于“数字实验室”IT 平台,涉及库尔恰托夫研究所超级计算机集群 HPC4,通过在超级计算机节点(1 个受试者 - 1 个节点)上并行计算,可以加快群组(2-350 个受试者)的数据处理速度。所提出的系统允许科学家远程使用安装在超级计算机上的专用软件来处理和分析 MRI/fMRI 数据;组织统一的数据存储;允许通过 Web 界面处理数据。该系统还允许使用 KI 研究人员开发的程序模块,这些程序模块实施数学方法来改进数据分析结果。作为该计算机模型实现的一个例子,介绍了模块“MRI FS”,它使用开放的专用软件 FreeSurfer v.6.0 自动处理和分析 MRI 数据。
蛋白质-配体对接是一种计算机模拟工具,用于在药物发现活动中筛选潜在药物化合物与给定蛋白质受体结合的能力。实验性药物筛选成本高昂且耗时,因此需要以高通量的方式进行大规模对接计算以缩小实验搜索空间。现有的计算对接工具中很少有考虑到高性能计算而设计的。因此,通过优化最大限度地利用领先级计算设施提供的高性能计算资源,可以使这些设施用于药物发现。在这里,我们介绍了 AutoDock-GPU 程序在 Summit 超级计算机上的移植、优化和验证,以及它在针对导致当前 COVID-19 大流行的 SARS-CoV-2 病毒蛋白的初步化合物筛选工作中的应用。1