决策问题通常被建模为马尔可夫决策过程(MDP),在线学习者依次与未知环境进行互动以获得大量的预期累积奖励。在文献中提出了许多没有任何约束(因此允许自由探索任何州行动对)的RL算法(因此可以自由探索任何州行动对)(Azar et al。,2017年; Jin等。,2018年; Agarwal等。,2019年; Jin等。,2020年; Jia等。,2020年;周等人。,2021b;他等人。,2022)。以外,现有的“安全” RL算法通常是在需要预期累积的约束下设计的,2019年; Brantley等。,2020年;丁等。,2021; Pa-Ternain等。,2022)(请参阅第1.2节中的更多相关工作)。因此,必须避免在每个时间/步骤中避免不安全状态和动作的实际情况。
摘要:随着战区日益复杂和对手不断推进,开发大量具有成本效益的无人机系统可能会为美国军队提供令人信服的能力。因此,研究问题涉及现有小型无人机系统的最佳组合,这些系统在给定预算和集群规模的情况下,提供最佳性能指标,即检测时间的平均/标准差和任务成功率。对这些小型无人机的要求是它们属于美国空军第 1-3 组无人机。研究小组使用 Python 模拟在 5 海里半径范围内的随机目标位置内收集不同小型无人机的单独性能数据。然后将这些指标输入优化程序,该程序在给定某些硬约束的情况下选择最佳组合。结果表明,6 个 ALADiN 和 24 个 Parallel Firefly 的组合是所有三种测试场景中的最佳组合。总成本为 160 万美元。利用模拟结果,该团队还能够推荐哪些属性对于成功完成任务最为重要,从而节省开发过程中的时间和金钱。
全球气候模型(GCM)是模拟气候演变并评估气候变化影响的主要工具。但是,它们通常以粗糙的空间分解运行,从而限制了它们在繁殖局部规模现象方面的准确性。利用深度学习的统计缩减方法通过近似粗略变量的局部尺度气候场来解决此问题,从而实现了区域GCM的投影。通常,感兴趣的不同变量的气候场是独立缩小的,从而违反了互连变量之间的基本物理特性。本研究研究了此问题的范围,并通过温度的应用为引入多变量硬约束的框架奠定了基础,该框架可以保证与降低气候变量的群体之间的身体关系。
摘要 - 近年来,由于诸如提高生产力和劳动力降低等福利,对农业机器人技术的兴趣已大大增加。但是,与非结构化环境相关的当前问题使机器人收割机的发展具有挑战性。大多数农业机器人技术的研究都集中在单臂操纵上。在这里,我们提出了一种双臂方法。我们提出了配备了RGB-D相机,切割和收集工具的双臂果实收集机器人。我们利用合作任务描述来最大化双臂机器人的功能。我们设计了一个基于分层的二次编程控制策略,以实现与机器人和环境相关的一系列硬约束:机器人联合限制,机器人自我收集,机器人 - 水果和机器人树的碰撞。我们结合了深度学习和标准图像处理算法,以检测和跟踪现场的树干。我们验证了对现实世界RGB-D图像的感知方法以及对模拟实验的控制方法。
摘要:随着战区日益复杂和对手不断推进,开发大量具有成本效益的无人机系统可能会为美国军队提供令人信服的能力。因此,研究问题涉及现有小型无人机系统的最佳组合,这些系统在给定预算和集群规模的情况下,提供最佳性能指标,即平均/标准偏差的检测时间,以及任务成功率。这些小型无人机系统的要求是它们属于美国空军 1-3 组无人机系统。研究小组使用 Python 模拟在 5 海里半径范围内的随机目标位置内收集不同小型无人机系统的单独性能数据。然后将这些指标输入到优化程序中,该程序在某些硬约束条件下选择最佳组合。结果表明,6 个 ALADiN 和 24 个并行 Firefly 的组合是所有三个测试场景中的最佳组合。总成本为 160 万美元。利用模拟得出的结论,该团队还能够推荐哪些属性对于成功的任务最为重要,从而节省开发过程中的时间和金钱。
摘要 - 车辆及其周围环境(V2X)之间的全国沟通是一项关键技术,可实现针对道路安全,交通流量和驾驶舒适度的合作智能运输系统(C-ITS)。基于椭圆曲线密码学(ECC)的真实性和机密性(主要依赖于应用程序)的安全服务,以满足低潜伏期安全通信的硬约束和在密集的交通状况下的有限带宽无线电通信。由于量子计算机(QC)提出的威胁,经典的非对称加密算法可能会破坏影响公共密钥基础设施(PKI)的安全解决方案,并对(半自治车辆和道路使用者和道路使用者产生负面的安全后果)。我们的项目(TAM:值得信赖的自主流动性)[18]专注于合作,联系和自动化流动性(CCAM)领域的端到端网络安全和隐私。一个主要目标是找到合适的量子安全方案,以替换基于V2X通信中使用的ECC的当前加密标准。在定义了C-ITS的主要要求和关键性能指标后,对当前NIST预标准PQC算法进行基准测试,以评估C-ITS应用程序中的可行性和性能,并根据结果选择了最佳拟合解决方案。
摘要 - 本文解决了在复杂制造环境中实施无标记的增强现实(AR)的挑战。使AR系统更加直观,健壮和适应性是使其在行业中成为可能的必需步骤。在不受控制的现实世界环境中遇到的硬约束中,我们显着面对生产线的动态性质以及在组装过程中对象的不断发展的外观。新兴深度学习(DL)方法启用了6D对象构成移动对象的AR注册的估计。但是,他们需要大量的6D对象构成地面真相数据。在现实世界的情况下,由于两个因素:建立精确的6D姿势标签程序的复杂性是在真实生产线中建立准确的6D姿势标签程序的复杂性,并且在整个组装线上遇到了各种各样的对象状态和外观。因此,有必要开发能够处理看不见的对象的替代6D构成估计技术。为此,本文介绍了一条新的管道,依靠HoloLens 2进行数据捕获,神经辐射场(NERF)进行3D模型生成,以及用于6D姿势估计的Megapose。所提出的方法可以实现6D姿势估计,而无需特定对象的训练或辛苦的姿势标签。
鉴于不断增长的需求和有限的财政资源,新兴经济体的电力行业在提供价格合理、环境可持续和安全的电力方面面临着特殊挑战。虽然供电可靠性通常很差,减排的优先级较低,但太阳能和风能现在是我们最便宜的供电选择之一,但变化很大。我们的研究旨在证明在未来发电规划中,在可靠性标准与更高的可再生能源和更低的行业成本之间进行权衡的潜在价值。我们使用基于开源进化编程的容量扩展规划工具 NEMO 来解决 2030 年印度尼西亚爪哇-巴厘岛电网的最低成本发电组合。我们明确测试了 0.005% e 5% 未服务能源 (USE) 的可靠性目标对成本和排放的影响,在成本函数中将其建模为硬优化约束和对 USE 的惩罚价格。我们的结果表明,降低可靠性目标可以增加太阳能和风能的渗透率,减少二氧化碳排放,同时降低行业成本。两种纳入可靠性的方法都产生了类似的结果,但定价 USE 在优化方面比硬约束设置有一些优势。虽然可靠性降低对消费者的影响需要仔细考虑,但我们的研究强调了新兴经济体发电规划中可能不切实际的可靠性目标对成本和排放造成的潜在影响。© 2021 Elsevier Ltd. 保留所有权利。
分散在悬浮液中的粘合剂颗粒可以自组装成刚性渗透的凝胶网络。凝胶无处不在,从蛋白质组装和胶体悬浮液到水泥水合物中。他们的结构和机械性能在很大程度上取决于它们通过粒子粒子相互作用和外部驾驶的形成历史,包括:排斥和吸引力强度,流动,活动和流体动力。在筛选长范围静电排斥并范德华力强的状态下,例如在盐水和浊度悬浮液中,摩擦固体接触可以在颗粒之间形成,阻碍相对滑动和滚动运动。摩擦会影响凝胶化动力学,其中网络可以在微米大小颗粒的几秒钟内形成和冻结。此外,接触老化可以转化为时间依赖性的弹性模量和产生应力。在数值侧,众所周知,强粘性悬浮液的凝胶对固体相互作用非常僵硬,这是很难的 - 它们在纳米表尺度上有所不同,而粒子是微米大小的。为了探测强粘性摩擦颗粒的极限,在实习期间,我们建议开发一种新型算法,以建模具有硬约束的布朗胶体颗粒的3D聚集,并将其转化为在动态歧管上的随机轨迹。这项工作将包括使用基于标准粒子的方法以及约束优化算法的使用。一起,我们将研究滑动和滚动摩擦如何影响凝胶化动力学,网络形成结构及其机械性能。