通过提高深度学习工作负载的利用率来降低成本是云提供商的关键杠杆。我们推出了 Singularity,这是微软的全球分布式调度服务,可高效可靠地执行深度学习训练和推理工作负载。Singularity 的核心是一种新颖的工作负载感知调度程序,它可以透明地抢占和弹性扩展深度学习工作负载,以提高利用率,而不会影响它们在全球 AI 加速器(如 GPU、FPGA)中的正确性或性能。默认情况下,Singularity 中的所有作业都是可抢占、可迁移和动态调整大小(弹性)的:实时作业可以动态且透明地 (a) 被抢占并迁移到不同的节点、集群、数据中心或区域集,并从抢占点准确恢复执行,以及 (b) 在给定类型的不同加速器集上调整大小(即弹性地扩大/缩小)。我们的机制是透明的,因为它们不需要用户对其代码进行任何更改,也不需要使用任何可能限制灵活性的自定义库。此外,我们的方法显著提高了深度学习工作负载的可靠性。我们表明,使用 Singularity 可以获得效率和可靠性的提升,而对稳态性能的影响可以忽略不计。最后,我们的设计方法与 DNN 架构无关,并且可以处理各种并行策略(例如数据/管道/模型并行)。
2 地理空间研究中心(NZ)有限公司,新西兰 1.简介 无人驾驶飞行器 (UAV) 是载人飞机和卫星的可行替代品,可用于各种应用,包括环境监测、农业和测量。与传统方法相比,它们具有更高的精度和更低的运营成本。自动驾驶系统对无人机系统的成功至关重要,该系统可以在没有人类飞行员的情况下让飞行器保持在空中并处于控制之中。无人机自动驾驶系统的开发是一个正在深入研究的领域。使用无人机软件飞行动力学模型在虚拟(软件)环境中测试自动驾驶系统的能力对于开发具有重要意义。可靠的无人机模拟过程可以适用于不同的飞机,这将为开发自动驾驶系统提供一个平台,减少对昂贵的现场试验的依赖。在许多情况下,在虚拟环境中测试新开发的自动驾驶系统是保证绝对安全的唯一方法。此外,该模型将在受控飞行环境中实现更好的测试重复性。飞行动力学的数值建模在航空航天工业中有着悠久的历史,并用于所有现代飞机和卫星的开发。飞行动力学模型是所提议的飞行器(在本例中为 UAV)预期的稳态性能和动态响应的数学表示(dcb.larc.nasa.gov/Introduction/ models.html)。飞行动力学模型的用途多种多样。商业、军事、政府组织和学术部门使用飞行模型来完成其特定任务(Chavez 等人2001)。示例应用包括控制算法测试、初步设计的稳定性和飞行特性评估、机载嵌入式自动驾驶系统和机载惯性导航系统 (INS)。在无人机和自动驾驶系统的开发中,用于飞行模拟的飞行动力学模型允许在计算机上进行快速和安全的测试。但是,从第一原理开发的软件模型的准确性未知。为了使这种模型真正发挥作用,其开发过程必须包括实施、验证和确认。本章介绍了开发过程每个阶段的方法。