摘要 — 科学应用越来越多地采用人工智能 (AI) 技术来推动科学发展。高性能计算中心正在评估新兴的新型硬件加速器,以有效运行 AI 驱动的科学应用。由于这些系统的硬件架构和软件堆栈种类繁多,因此很难理解这些加速器的性能。深度学习工作负载评估的最新进展主要集中在 CPU 和 GPU 上。在本文中,我们概述了 SambaNova、Cerebras、Graphcore 和 Groq 的基于数据流的新型 AI 加速器。我们首次对这些加速器进行了评估,评估内容包括深度学习 (DL) 原语、基准模型和科学机器学习应用程序等多种工作负载。我们还评估了集体通信的性能,这对于分布式 DL 实现至关重要,同时还研究了扩展效率。然后,我们讨论将这些新型 AI 加速器集成到超级计算系统中的关键见解、挑战和机遇。
摘要:由于微电网中的系统惯性低,频率可能会迅速偏离标称值,导致系统完全停电,除非有足够的旋转备用来平衡供电和需求负载。孤岛运行下微电网的不稳定问题最近引起了特别的关注。柴油发电机被认为是理想的旋转备用,可在孤岛系统中为负载提供备用电源以及可再生能源。然而,柴油发电机的高维护成本和二氧化碳排放量是有害因素,这促使人们寻求更具成本效益和更清洁的技术。在孤岛系统中,将储能系统 (ESS) 与发电机集成不仅可以降低发电机的维护成本,还可以通过限制其运行时间来减少二氧化碳排放。本文提出了一种孤岛光伏混合微电网系统 (PVHMS),利用飞轮储能系统 (FESS) 作为电池技术的替代方案,以支持光伏系统并满足拥有 100 户住宅的小型住宅镇的峰值需求。当光伏系统和飞轮储能无法满足负载需求时,柴油发电机在孤岛系统中用作旋转备用,以维持孤岛系统的稳定性。对此类系统的分析结果表明,适当规模的飞轮储能技术为支持独立光伏系统的运行提供了可行的解决方案。此外,与飞轮储能系统(意味着柴油发电机始终在运行)的情况相比,二氧化碳排放量和燃料消耗的减少量已经量化。
1 奇特卡拉大学电气工程系,奇特卡拉大学工程技术学院,旁遮普 140417,印度;mukul.chankaya@chitkara.edu.in 2 克什米尔大学电气工程系,斯利那加 190006,印度;ikhlaqh@uok.edu.in 3 BEARS,大学城,新加坡国立大学校园,新加坡 138602,新加坡 4 马来西亚理工大学(UTM)工程学院电气工程学院电力工程系,柔佛州新山 81310,马来西亚 5 斯利那加国家理工学院电气工程系,斯利那加 190006,印度; aijaz54@nitsri.net 6 沙特阿拉伯国王沙特大学工程学院电气工程系,利雅得 11421,沙特阿拉伯 7 西班牙卡斯蒂利亚-拉曼恰大学 Ingenium 研究组,雷阿尔城 13071;faustopedro.garcia@uclm.es * 通信地址:hasmat.malik@gmail.com (HM);majedalotaibi@ksu.edu.sa (MAA)
摘要:波浪能是一种可再生能源,有潜力满足全球电力需求,但仍然存在的挑战是波浪能转换器在恶劣的海上条件下的生存能力。为了了解系统动力学并提高可靠性,通常进行实验和数值研究。然而,这些过程既昂贵又耗时。能够提供等效结果的统计模型是一种很有前途的方法。在本研究中,开发并实施了 CFD 解决方案的数字孪生,用于预测极端波浪条件下点吸收器波浪能转换器系泊系统中的力。结果表明,数字孪生可以以 90.36% 的平均准确率预测系泊力。此外,数字孪生只需几秒钟即可提供解决方案,而 CFD 代码则需要几天的时间。通过创建波浪能转换器的数字模拟并展示它能够预测极端波浪条件下关键部件的负载,这项工作构成了波浪能领域的一种创新方法。
通过提高深度学习工作负载的利用率来降低成本是云提供商的关键杠杆。我们推出了 Singularity,这是微软的全球分布式调度服务,可高效可靠地执行深度学习训练和推理工作负载。Singularity 的核心是一种新颖的工作负载感知调度程序,它可以透明地抢占和弹性扩展深度学习工作负载,以提高利用率,而不会影响它们在全球 AI 加速器(如 GPU、FPGA)中的正确性或性能。默认情况下,Singularity 中的所有作业都是可抢占、可迁移和动态调整大小(弹性)的:实时作业可以动态且透明地 (a) 被抢占并迁移到不同的节点、集群、数据中心或区域集,并从抢占点准确恢复执行,以及 (b) 在给定类型的不同加速器集上调整大小(即弹性地扩大/缩小)。我们的机制是透明的,因为它们不需要用户对其代码进行任何更改,也不需要使用任何可能限制灵活性的自定义库。此外,我们的方法显著提高了深度学习工作负载的可靠性。我们表明,使用 Singularity 可以获得效率和可靠性的提升,而对稳态性能的影响可以忽略不计。最后,我们的设计方法与 DNN 架构无关,并且可以处理各种并行策略(例如数据/管道/模型并行)。
除了提供电网集成服务外,Powin 还必须满足多项设计考虑才能符合奥兰治县消防局 (OCFD) 的要求。鉴于该地区人口密度高,OCFA 对项目安全性的关注度更高。作为该项目的一部分,Powin 的系统 Stack230E 产品获得了 UL1973 认证,并获得了 UL9540 现场认证。此外,还根据普遍接受的消防安全标准 NFPA855 进行了与 NFPA 68 和 NFPA 69 相关的广泛危害分析。在现场,OCFA 对消防系统的每个组件进行了广泛检查,包括热和烟雾探测器、灭火罐和预配置的消防面板,所有这些都与 Powin 的基于外壳的解决方案集成在一起。
摘要 — GPU 被广泛用于加速机器学习工作负载的训练。随着现代机器学习模型变得越来越大,它们需要更长的时间来训练,从而导致更高的 GPU 能耗。本文介绍了 GPOEO,这是一种用于机器学习训练工作负载的在线 GPU 能量优化框架。GPOEO 通过采用新颖的在线测量、多目标预测建模和搜索优化技术来动态确定最佳能量配置。为了表征目标工作负载行为,GPOEO 使用 GPU 性能计数器。为了减少性能计数器分析开销,它使用分析模型来检测训练迭代变化,并且仅在检测到迭代偏移时收集性能计数器数据。GPOEO 采用基于梯度提升的多目标模型和局部搜索算法来找到执行时间和能耗之间的权衡。我们通过将 GPOEO 应用于在 NVIDIA RTX3080Ti GPU 上运行的两个 AI 基准测试套件中的 71 个机器学习工作负载来评估它。与 NVIDIA 默认调度策略相比,GPOEO 平均节能 16.2%,平均执行时间略有增加 5.1%。
1个儿童癌症研究所,洛伊癌症研究中心,澳大利亚悉尼,悉尼,悉尼,悉尼,澳大利亚2052年; pconnerty@ccia.org.au(p.c.); emoles@ccia.org.au(E.M.); cdebock@ccia.org.au(C.E.D.B。); njayatille@ccia.org.au(N.J。); cmayoh@ccia.org.au(c.m.); mkavallaris@ccia.org.au(m.k.)2 2 2052年,悉尼,悉尼,澳大利亚悉尼3新南威尔士大学儿童癌症研究中心,UNSW悉尼,新南威尔士州悉尼,2052年,澳大利亚4澳大利亚纳米医学中心,澳大利亚纳米医学中心美国华盛顿州西雅图市癌症研究中心,美国98109; jlsmith3@fredhutch.org(J.L.S. ); smeshinc@fredhutch.org(s.m。) 6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。 : +61-(02)-7209-6765†这些作者对这项工作也同样贡献。2 2052年,悉尼,悉尼,澳大利亚悉尼3新南威尔士大学儿童癌症研究中心,UNSW悉尼,新南威尔士州悉尼,2052年,澳大利亚4澳大利亚纳米医学中心,澳大利亚纳米医学中心美国华盛顿州西雅图市癌症研究中心,美国98109; jlsmith3@fredhutch.org(J.L.S. ); smeshinc@fredhutch.org(s.m。) 6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。 : +61-(02)-7209-6765†这些作者对这项工作也同样贡献。2 2052年,悉尼,悉尼,澳大利亚悉尼3新南威尔士大学儿童癌症研究中心,UNSW悉尼,新南威尔士州悉尼,2052年,澳大利亚4澳大利亚纳米医学中心,澳大利亚纳米医学中心美国华盛顿州西雅图市癌症研究中心,美国98109; jlsmith3@fredhutch.org(J.L.S. ); smeshinc@fredhutch.org(s.m。) 6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。 : +61-(02)-7209-6765†这些作者对这项工作也同样贡献。2 2052年,悉尼,悉尼,澳大利亚悉尼3新南威尔士大学儿童癌症研究中心,UNSW悉尼,新南威尔士州悉尼,2052年,澳大利亚4澳大利亚纳米医学中心,澳大利亚纳米医学中心美国华盛顿州西雅图市癌症研究中心,美国98109; jlsmith3@fredhutch.org(J.L.S. ); smeshinc@fredhutch.org(s.m。) 6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。 : +61-(02)-7209-6765†这些作者对这项工作也同样贡献。2 2052年,悉尼,悉尼,澳大利亚悉尼3新南威尔士大学儿童癌症研究中心,UNSW悉尼,新南威尔士州悉尼,2052年,澳大利亚4澳大利亚纳米医学中心,澳大利亚纳米医学中心美国华盛顿州西雅图市癌症研究中心,美国98109; jlsmith3@fredhutch.org(J.L.S. ); smeshinc@fredhutch.org(s.m。) 6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。 : +61-(02)-7209-6765†这些作者对这项工作也同样贡献。2 2052年,悉尼,悉尼,澳大利亚悉尼3新南威尔士大学儿童癌症研究中心,UNSW悉尼,新南威尔士州悉尼,2052年,澳大利亚4澳大利亚纳米医学中心,澳大利亚纳米医学中心美国华盛顿州西雅图市癌症研究中心,美国98109; jlsmith3@fredhutch.org(J.L.S.); smeshinc@fredhutch.org(s.m。)6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。 : +61-(02)-7209-6765†这些作者对这项工作也同样贡献。6小儿血液学/肿瘤科,华盛顿大学西雅图,华盛顿州98109,美国 *通信:rlock@ccia.org.au;电话。: +61-(02)-7209-6765†这些作者对这项工作也同样贡献。
带有 SMT2 的 5+ GHz 无序流水线 重新设计的分支预测 – 集成的 1 级和 2 级 BTB – 动态 BTB 条目重新配置 – 最多 >270k 个分支目标表条目
摘要:混合水能系统通常与抽水蓄能系统一起进行分析,抽水蓄能系统可以促进从其他来源积累能量。尽管缺乏水库,但径流式水电站也因其投资成本低、建设时间短和对环境影响小而对混合系统具有吸引力。在本研究中,研究了一个混合系统,该系统包含径流式小水电站 (SHP)、光伏系统和电池,用于为当地负载提供服务。考虑使用变速运行的低功率和低水头方案。本研究的新颖之处在于提出了一种专用的径流式水电站稳态模型,该模型适用于不同水文条件下的能量生产分析。基于 150 kW 容量的实际 SHP 的计算表明,简化方法可能导致对生产能量的估计高估 43%。此外,使用实际河流流量数据对混合系统运行进行为期一年的分析表明,流量平均周期对能量平衡结果有显著影响。通过将平均时间从一天增加到一个月,系统能量短缺和过剩可能会被低估约 25%。