最近的研究表明,基于深层执行学习的主动对象跟踪算法具有模型训练的困难,同时实现了有利的跟踪结果。此外,当前的活动对象跟踪方法不适合在高空环境中(例如空气搜索和重新设置)中的空对地面对象跟踪方案。因此,我们提出了一种用于主动对象跟踪的知识引导的增强学习(KURL)模型,其中包括两个嵌入式知识引导的模型(即国家识别模型和世界模型),以及增强学习模式。状态识别模型利用观察到的状态与图像质量(通过对象识别概率衡量)之间的相关性作为先验知识来指导强化学习算法以提高观察到的图像质量。增强学习模块会积极控制Pan-Tilt-Zoom(PTZ)相机以实现稳定的跟踪。此外,还提出了一种世界模型来代替用于模型训练的传统虚幻引擎(UE)模拟器,从而大大提高了训练效率(大约十次)。结果表明,与类似任务中的其他方法相比,KURL模型可以显着提高跟踪的图像质量,稳定性和鲁棒性。关键字:活动对象跟踪;强化学习;知识引导; PTZ摄像机;自动控制。
撰稿人 Thomas S. Axworthy、Andrew Balfour、Yaroslav Baran、James Baxter、Daniel Béland、Derek H. Burney、Catherine Cano、Stéphanie Chouinard、Margaret Clarke、David Coletto、Rachel Curran、Paul Deegan、John Delacourt、Susan Delacourt、Graham Fraser、Dan Gagnier、Helaina Gaspard、Martin Goldfarb、Sarah Goldfeder、Patrick Gossage、Frank Graves、David Johnston、Jeremy Kinsman、Shachi Kurl、Philippe Lagassé、Brad Lavigne、Jeremy Leonard、Kevin Lynch、Leslie MacKinnon、Peter Mansbridge、Carissima Mathen、Elizabeth May、Velma McColl、Elizabeth Moody McIninch、David McLaughlin、David Mitchell、Don Newman、Geoff Norquay、Fen Osler-Hampson、Kevin Page、André Pratte、Lee Richardson、Colin Robertson、Robin V. Sears、Vianne Timmons、Brian Topp、Lori Turnbull、Jaime Watt、Anthony Wilson-Smith、Dan Woynillowicz