摘要 — 人工智能的运营已成为研究和工业界的一项重大努力。管理人工智能应用程序生命周期的自动化运营管道将成为未来基础设施工作负载的重要组成部分。为了优化生产级人工智能工作流平台的运营,我们可以利用现有的调度方法,但要微调运营策略以实现特定于应用程序的成本效益权衡,同时满足机器学习 (ML) 模型的特定领域特征,例如准确性、稳健性或公平性,是一项挑战。我们提出了一个基于跟踪驱动的模拟实验和分析环境,使研究人员和工程师能够设计和评估大规模人工智能工作流系统的此类运营策略。IBM 开发的生产级人工智能平台的分析数据用于构建综合模拟模型。我们的模拟模型描述了管道和系统基础设施之间的交互,以及管道任务如何影响不同的 ML 模型指标。我们在独立的随机离散事件模拟器中实现了该模型,并提供了运行实验的工具包。合成跟踪可用于临时探索以及实验的统计分析,以测试和检查管道调度、集群资源分配和类似的操作机制。
摘要 - 为了克服自动飞行中无人驾驶汽车(无人机)避免障碍物的挑战,本文提出了双重体验注意力卷积软卷积 - 批评者(DAC-SAC)算法。该算法与卷积网络集成了双重体验缓冲池,自我注意力的机制和软性批判性算法。由于缺乏成功的培训数据,双重体验缓冲池用于解决无效的无人机培训问题。为了克服处理图像数据中原始软演员 - 批评(SAC)算法的缺点,应用了卷积神经网络(CNN)来重建参与者和评论家网络,从而可以更好地提取图像特征提取和分类。此外,通过向网络添加卷积自我发项层来采用一种自我注意的机制。此修改可以根据不同输入图像特征对注意力重量进行动态调整,从而有效解决与焦点相关的挑战。进行了两个模拟实验,并且在处理未知环境时,DAC-SAC算法在已知环境中达到99.5%的成功率,成功率为84.8%。这些结果证实,即使将深度图像作为输入,提出的算法也可以避免无人机的自主障碍。
从演示中学习是用户教机器人的常见方法,但它很容易出现虚假的特征相关性。最近的工作构建了状态抽象,即具有与任务相关特征的视觉表示,从语言作为执行更具概括性学习的方式。但是,这些抽象还取决于用户对任务中重要的内容的偏好,而单独使用语言可能很难描述或不可证明。我们如何构建抽象来捕获这些潜在偏好?我们观察到人类的行为如何揭示了他们如何看待世界。我们的关键见解是,人类行为的变化告诉我们,人们对人类看待世界的偏好有所不同,即他们的状态抽象。在这项工作中,我们建议使用语言模型(LMS)查询直接知道行为发生变化的偏好。在我们的框架中,我们以两种方式使用LM:FRST,给定对任务的文字描述和状态之间行为变化的知识,我们向LM查询可能的隐藏偏好;其次,考虑到最可能的偏好,我们询问LM以构建状态抽象。在这个框架中,LM还可以直接询问人类自己的估计。我们证明了我们的框架在模拟实验,用户研究以及执行移动操作任务的实际点机器人中构建有效的偏好条件抽象的能力。
摘要:比特币是全球最受欢迎的加密货币,近年来经常发生价格变化。比特币的价格达到了一个新的高峰,2021年7月近65,000美元。然后,在2022年下半年,比特币价格开始逐渐下降,下降到20,000美元以下。比特币价格的巨大变化吸引了数百万人投资和赚取利润。这项研究重点是比特币价格变化的预测,并为投资者的交易比特币提供了参考。在这项研究中,我们考虑了一种方法,我们首先应用了几种传统的机器学习回归模型来预测比特币价格中的移动平均值的变化,然后根据预测的结果,我们为比特币价格变化设置了标签,以获得分类结果。这项研究表明,将回归结果转换为分类分析的方法比相应的机器学习分类模型可以实现更高的准确性,而最佳准确度为0.81。此外,根据这种方法,该研究构建了一种机器学习交易策略,以与传统的双移动平均策略进行比较。在模拟实验中,机器学习交易策略的性能也更好,并获得了68.73%的年度回报。
摘要 — 近年来深度学习 (DL) 模型的爆炸式增长使得人们迫切需要在 GPU 集群中对混合并行分布式深度学习训练 (DDLwMP) 进行高效的作业调度。本文提出了一种自适应最短剩余处理时间优先 (A-SRPT) 调度算法,这是一种新颖的预测辅助在线调度方法,旨在缓解与 DL 集群调度相关的挑战。通过将每个作业建模为与异构深度神经网络 (DNN) 模型及其相关的分布式训练配置相对应的图,A-SRPT 策略性地将作业分配给可用的 GPU,从而最大限度地减少服务器间的通信开销。观察到大多数 DDLwMP 作业会重复出现,A-SRPT 结合随机森林回归模型来预测训练迭代。至关重要的是,A-SRPT 将复杂的调度问题映射到单机实例中,该实例通过抢占式“最短剩余处理时间优先”策略得到最佳解决。该优化解决方案可作为 GPU 集群内实际作业调度的指南,从而实现理论上可证明的竞争性调度效率。我们进行了广泛的真实测试平台和模拟实验来验证我们提出的算法。
摘要 — 近年来深度学习 (DL) 模型的爆炸式增长使得人们迫切需要在 GPU 集群中对混合并行分布式深度学习训练 (DDLwMP) 进行高效的作业调度。本文提出了一种自适应最短剩余处理时间优先 (A-SRPT) 调度算法,这是一种新颖的预测辅助在线调度方法,旨在缓解与 DL 集群调度相关的挑战。通过将每个作业建模为与异构深度神经网络 (DNN) 模型及其相关的分布式训练配置相对应的图,A-SRPT 策略性地将作业分配给可用的 GPU,从而最大限度地减少服务器间的通信开销。观察到大多数 DDLwMP 作业会重复出现,A-SRPT 结合随机森林回归模型来预测训练迭代。至关重要的是,A-SRPT 将复杂的调度问题映射到单机实例中,该实例通过抢占式“最短剩余处理时间优先”策略得到最佳解决。该优化解决方案可作为 GPU 集群内实际作业调度的指南,从而实现理论上可证明的竞争性调度效率。我们进行了广泛的真实测试平台和模拟实验来验证我们提出的算法。
摘要:机场执行与航空运输过程开始和结束相关的许多操作。这些操作中的每一个对于空中交通的安全都很重要。然而,由于严重性,最重要的是在跑道上进行的起飞和降落操作。在许多机场,存在两条相交跑道的系统。在这种情况下,通常其中一条跑道用于起飞,而另一条跑道用于降落。这可以增加机场的容量。现有程序旨在确保此过程的安全。然而,交通干扰(例如与天气有关)以及空中交通管制员和飞行员的失误可能会导致跑道交叉口发生碰撞。本研究的目的是估计在执行程序时受到干扰的情况下跑道交叉口发生碰撞的概率。为此,我们创建了一个交叉跑道上的空中交通模型,这些跑道交替用于起飞和降落。该模型是作为分层有色 Petri 网开发的。模型中定义并包括了几组潜在干扰以及飞机在着陆和起飞阶段的运动动态。使用该模型进行了大量模拟实验,从而评估了交叉跑道上的交通安全性。开发的软件工具可以确定保护措施的有效性,例如使用额外的技术手段来检测通过跑道交叉口的飞机。该模型和工具已在华沙肖邦机场实施,具有所讨论的跑道结构。
从演示中学习是用户教机器人的常见方法,但它很容易出现虚假的特征相关性。最近的工作构建了状态抽象,即具有与任务相关特征的视觉表示,从语言作为执行更具概括性学习的方式。但是,这些抽象还取决于用户对任务中重要的内容的偏好,而单独使用语言可能很难描述或不可证明。我们如何构建抽象来捕获这些潜在偏好?我们观察到人类的行为如何揭示了他们如何看待世界。我们的关键见解是,人类行为的变化告诉我们,人类如何看待世界的偏好存在差异,即他们的状态抽象。在这项工作中,我们建议使用语言模型(LMS)查询直接知道行为发生变化的偏好。在我们的框架中,我们以两种方式使用LM:首先,给定对任务的文字描述和状态之间行为变化的知识,我们向LM查询可能的隐藏偏好;其次,考虑到最可能的偏好,我们询问LM以构建状态抽象。在这个框架中,LM还可以直接询问人类自己的估计。我们证明了我们的框架在模拟实验,用户研究以及执行移动操纵任务的真实斑点机器人中构建有效的偏好条件抽象的能力。
为了模拟原位 Z TH,ja 提取,对安装在 PM 上的其中一个设备采用了“模拟实验”策略。该过程如下:•首先,通过 COMSOL Multiphysics 环境中的详细纯热 3-D FEM 模拟获得设备的参考 Z TH,ja [24],其中重现了 PM 的精确复制品(图 3)。边界条件通过施加于厚铜底板底面的传热系数 h =2×10 3 W/m 2 K 来解释,这描述了与高效散热器的接触 [25]。•获得的参考 Z TH,ja 用于构建具有 Foster 拓扑的 SPICE 兼容热反馈网络 (TFN) [26];然后将 TFN 耦合到 VDMOS 晶体管的电气模型,该晶体管的温度敏感参数可以在模拟运行期间发生变化。电气模型根据实验数据 [27] 进行了校准,并在 [28] 中进行了详细描述。• 使用 OrCAD Capture 软件包 [29] 对 ET 模型进行了瞬态模拟,以模拟第 II.B 节中介绍的实验程序来提取 z ja 。• 通过在 COMSOL 中模拟 300 K 等温背面的裸片器件来确定 Z jc 。• 然后进行反归一化过程和时域转换以获得热阻抗 Z TH,ja 。• 最后比较了参考值和提取的 Z TH,ja 。
现代神经科学在不断增加和更详细的神经网络上采用计算机模拟实验。高建模细节与高模型可重复性、可重用性和透明度的需求密切相关。此外,模型的大小和研究中的长时间尺度要求使用具有高计算性能的模拟系统,以提供可接受的结果时间。在这项工作中,我们提出了 EDEN(网络可扩展动态引擎),这是一种新的通用、基于 NeuroML 的神经模拟器,通过创新的模型分析和代码生成技术实现了高模型灵活性和高计算性能。该模拟器直接运行 NeuroML-v2 模型,无需用户学习另一种特定于模拟器的模型规范语言。EDEN 的功能正确性和计算性能通过 NeuroML-DB 和开源大脑模型存储库中提供的 NeuroML 模型进行评估。在定性实验中,EDEN 生成的结果针对各种模型与现有的 NEURON 模拟器进行了验证。同时,计算性能基准测试表明,EDEN 的运行速度比典型台式计算机上的 NEURON 快一到两个数量级,而且无需用户付出额外努力。最后,无需用户付出额外努力,EDEN 已从头开始构建,可在多个 CPU 和计算机集群(如果可用)上无缝扩展。