摘要 — 主动目标感知是在环境中发现和分类未知数量目标的任务,在搜索和救援任务中至关重要。本文开发了一种深度强化学习方法来规划信息轨迹,从而增加无人驾驶飞行器 (UAV) 发现失踪目标的可能性。我们的方法有效地 (1) 探索环境以发现新目标,(2) 利用其当前对目标状态的信念并结合不准确的传感器模型进行高保真分类,以及 (3) 通过使用运动原语库为敏捷无人机生成动态可行轨迹。在随机生成的环境中进行的大量模拟表明,我们的方法在发现和分类目标方面比其他几种基线更有效。与启发式信息路径规划方法相比,我们的方法的一个独特特点是,它对先验信念与真实目标分布的不同偏差具有鲁棒性,从而减轻了针对应用条件设计启发式方法的挑战。
主要关键词