附录 A – 职责:第 7 页附录 B – 维护部门组织:第 21 页附录 C – 维修车间运营:第 22 页附录 D – 定期服务:第 26 页附录 E – 指挥维护程序:第 33 页附录 F – 调度程序:第 38 页附录 G – 操作员许可和培训:第 42 页附录 H – 安全:第 50 页附录 I – 环境保护:第 56 页附录 J – 车队安全:第 63 页附录 K – 驾驶员和机械师奖励:第 65 页附录 L – TMDE:第 67 页附录 M – AOAP:第 69 页附录 N – 工具控制程序:第 75 页附录 O – SSL 程序:第 77 页附录 P – GCSS-A 操作:第84 附录 Q – 受控交换:第 86 页 附录 R – 恢复操作:第 88 页 附录 S – 操作后维护:第 91 页 附录 T – 维护培训:第 95 页 附录 U – 出版物:第 102 页 附录 V – 车辆调配池外观标准:第 104 页
摘要-Multi-UAV系统在处理大规模,动态和冷启动(即有限的先验知识)场景(例如野火抑制)中的复杂任务方面已经显示出巨大的潜力。由于动态和随机的环境条件,应同时执行感应任务(即火灾监控)和操作任务(即抑制火灾)的时间表,以实现实时信息收集和及时干预环境。但是,感应和操作任务的计划包含通常是不一致的,并且随着时间的流逝而发展,这使确定每个无人机的最佳策略的任务变得复杂。为了解决这个问题,本文提出了Soscheduler,这是一个合作的多UAV调度框架,用于在大规模和Dynamic Wildfire环境中进行集成感应和操作。我们引入了一个时空的置信度感知评估模型,直接和直接查明位置,这些位置可以最佳地增强对环境动力学和操作有效性的理解,以及优先的图形结构可扩展调度程序,以高效的方式协调多-UAV。对实际多uav测试床和大规模物理特征模拟的实验表明,与最新的(SOTA)解决方案相比,我们的Soscheduler将火灾膨胀率降低了59%,并将火灾覆盖率提高了190%。
摘要 — 随着量子计算的普及度不断提高,通过云高效访问量子机对全球学术和行业研究人员都至关重要。随着云量子计算需求呈指数级增长,资源消耗和执行特性分析是供应商端和客户端高效管理作业和资源的关键。虽然作业/资源消耗和管理的分析和优化在传统 HPC 领域很流行,但对于量子计算等新兴技术来说,它却严重缺乏。本文提出了优化的量子云自适应作业调度,注意主要特征,例如排队时间和跨机器的保真度趋势,以及其他特征,例如服务质量保证和机器校准约束。该提案的关键组成部分包括 a) 基于编译电路特征(例如电路深度和不同形式的错误)预测跨机器保真度趋势的预测模型,以及 b) 基于执行时间估计的每台机器的排队时间预测。总体而言,该提案在模拟 IBM 机器上针对多种量子应用程序和系统加载场景进行了评估,与传统作业调度程序相比,它能够在特定用例中将等待时间减少 3 倍以上,并将保真度提高 40% 以上。
联邦学习 (FL) 是一种新兴的机器学习技术,它支持跨数据孤岛或边缘设备进行分布式模型训练,而无需数据共享。然而,与集中式模型训练相比,FL 不可避免地会带来效率低下的问题,这将进一步增加未来机器学习本已很高的能耗和相关的碳排放。减少 FL 碳足迹的一种方法是根据电网中特定时间和地点可能出现的可再生过剩能源的可用性来安排训练作业。然而,面对如此不稳定且不可靠的资源,现有的 FL 调度程序无法始终确保快速、高效和公平的训练。我们提出了 FedZero,这是一个专门依靠可再生过剩能源和计算基础设施的闲置容量运行的 FL 系统,可有效地将训练的运营碳排放量降至零。通过利用能源和负荷预测,FedZero 通过选择客户端实现快速收敛和公平参与,从而利用过剩资源的时空可用性。我们基于实际的太阳和负载轨迹进行的评估表明,在上述约束条件下,FedZero 的收敛速度明显快于现有方法,同时消耗的能量更少。此外,它对预测误差具有很强的鲁棒性,可扩展到数万个客户端。
联邦学习 (FL) 是一种新兴的机器学习技术,它支持跨数据孤岛或边缘设备进行分布式模型训练,而无需数据共享。然而,与集中式模型训练相比,FL 不可避免地会带来效率低下的问题,这将进一步增加未来机器学习本已很高的能耗和相关的碳排放。减少 FL 碳足迹的一种方法是根据电网中特定时间和地点可能出现的可再生过剩能源的可用性来安排训练作业。然而,面对如此不稳定且不可靠的资源,现有的 FL 调度程序无法始终确保快速、高效和公平的训练。我们提出了 FedZero,这是一个专门依靠可再生过剩能源和计算基础设施的闲置容量运行的 FL 系统,可有效地将训练的运营碳排放量降至零。通过利用能源和负荷预测,FedZero 通过选择客户端实现快速收敛和公平参与,从而利用过剩资源的时空可用性。我们基于实际的太阳和负载轨迹进行的评估表明,在上述约束条件下,FedZero 的收敛速度明显快于现有方法,同时消耗的能量更少。此外,它对预测误差具有很强的鲁棒性,可扩展到数万个客户端。
通过提高深度学习工作负载的利用率来降低成本是云提供商的关键杠杆。我们推出了 Singularity,这是微软的全球分布式调度服务,可高效可靠地执行深度学习训练和推理工作负载。Singularity 的核心是一种新颖的工作负载感知调度程序,它可以透明地抢占和弹性扩展深度学习工作负载,以提高利用率,而不会影响它们在全球 AI 加速器(如 GPU、FPGA)中的正确性或性能。默认情况下,Singularity 中的所有作业都是可抢占、可迁移和动态调整大小(弹性)的:实时作业可以动态且透明地 (a) 被抢占并迁移到不同的节点、集群、数据中心或区域集,并从抢占点准确恢复执行,以及 (b) 在给定类型的不同加速器集上调整大小(即弹性地扩大/缩小)。我们的机制是透明的,因为它们不需要用户对其代码进行任何更改,也不需要使用任何可能限制灵活性的自定义库。此外,我们的方法显著提高了深度学习工作负载的可靠性。我们表明,使用 Singularity 可以获得效率和可靠性的提升,而对稳态性能的影响可以忽略不计。最后,我们的设计方法与 DNN 架构无关,并且可以处理各种并行策略(例如数据/管道/模型并行)。
联邦学习 (FL) 是一种新兴的机器学习技术,它支持跨数据孤岛或边缘设备进行分布式模型训练,而无需数据共享。然而,与集中式模型训练相比,FL 不可避免地会带来效率低下的问题,这将进一步增加未来机器学习本已很高的能耗和相关的碳排放。减少 FL 碳足迹的一种方法是根据电网中特定时间和地点可能出现的可再生过剩能源的可用性来安排训练作业。然而,面对如此不稳定且不可靠的资源,现有的 FL 调度程序无法始终确保快速、高效和公平的训练。我们提出了 FedZero,这是一个专门依靠可再生过剩能源和计算基础设施的闲置容量运行的 FL 系统,可有效地将训练的运营碳排放量降至零。通过利用能源和负荷预测,FedZero 通过选择客户端实现快速收敛和公平参与,从而利用过剩资源的时空可用性。我们基于实际的太阳和负载轨迹进行的评估表明,在上述约束条件下,FedZero 的收敛速度明显快于现有方法,同时消耗的能量更少。此外,它对预测误差具有很强的鲁棒性,可扩展到数万个客户端。
分布式机器学习(ML)在当今的AI服务扩散中发挥了关键作用。分布式ML的典型模型是通过多个工人节点对训练数据集进行分区训练数据集,以并行更新模型参数,采用参数服务器档案。ML培训作业通常是资源弹性,使用具有不同资源配置的各种时间长度完成。分布式ML集群中的一个基本问题是如何探索ML作业的需求弹性并以不同的资源配置安排它们,以便最大化资源的利用并最小化了平均职位完成时间。为了解决它,我们提出了一种在线调度算法,以确定执行时间窗口,到达时的同时工人和参数服务器的数字和类型,目的是最大程度地减少加权平均完成时间。我们的在线算法由(i)在线调度框架组成,该框架将未加工的ML培训作业分组为批次迭代,以及(ii)批处理调度算法,该算法配置每个ML作业以最大程度地提高当前迭代中计划的总重量。我们的在线算法可以保证具有多项式时间复杂性的良好参数化竞争比率。使用现实世界数据进行的广泛评估表明,它在当今的AI云系统中优于最先进的调度程序。
•当发生在下一个工作日之前需要立即注意的事件时,UPD调度员应首先与值班建筑服务工程师(BSE)联系,以确定是否可以解决该事件。设施维护经理有责任确保为UPD提供当前的建筑服务工程师的工作时间表。UPD将通过无线电与值班的建筑服务工程师联系。•如果建筑物服务工程师表示无法解决事件,则该工程师将要求UPD调度员致电适当的设施管理紧急联系人,如下所示。•紧急联系人#:826-4466•已采用单个中央紧急联系电话。当BSE指示该事件无法解决或校园内没有BSE可用时,使用此单个数字时,当前的呼叫管理器将自动拨号。如果在此号码拨打此数字时没有达到任何人,将按照下面的概述进行。•UPD调度程序应在紧急联系人列表的顶部开始,然后按顺序列出的所有电话号码,直到直接到达联系人为止。•UPD调度员达到的第一个可用设施管理紧急联系人应负责协调和管理对提出的问题的回应。•收到UPD调度员的消息或错过的电话后,设施管理应急人员将与UPD Dispatcher(826-55555)联系,以确保对事件的适当响应已执行。
NISQ 时代量子计算 (QC) 的快速发展迫切需要一个低级基准测试套件和深刻的评估指标,以表征原型 NISQ 设备的特性、QC 编程编译器、调度程序和汇编程序的效率以及经典计算机中量子系统模拟器的能力。在这项工作中,我们通过基于 OpenQASM 汇编表示提出一个低级、易于使用的基准测试套件 QASMBench 来弥补这一空白。它整合了来自化学、模拟、线性代数、搜索、优化、算术、机器学习、容错、密码学等各个领域的常用量子例程和内核,在通用性和可用性之间进行权衡。为了从 NISQ 设备执行的角度分析这些内核,除了电路宽度和深度之外,我们还提出了四个电路指标,包括门密度、保留寿命、测量密度和纠缠方差,以提取有关执行效率、NISQ 误差敏感性以及机器特定优化的潜在收益的更多见解。QASMBench 中的应用程序可以在多个 NISQ 平台上启动和验证,包括 IBM-Q、Rigetti、IonQ 和 Quantinuum。为了进行评估,我们通过密度矩阵状态断层扫描测量 12 台 IBM-Q 机器上 QASMBench 应用程序子集的执行真实性,包括 25K 电路评估。我们还比较了 IBM-Q 机器、IonQ QPU 和 Rigetti Aspen M-1 系统之间的执行真实性。QASMBench 发布在:http://github.com/pnnl/QASMBench。