摘要。移动机器人和许多Edge AI设备需要对计算功率进行贸易,以防止功耗,电池尺寸和电荷之间的时间。因此,与通常用于训练和评估深层神经网络的功能强大的基于强大的基于GPU的系统相比,这种设备具有明显较小的计算能力是很常见的。对象检测是机器人和边缘设备的视觉感知的关键方面,但是在基于GPU的系统上运行最快的流行对象检测体系结构或旨在用大型输入图像尺寸最大化地图的旨在,可能无法很好地扩展到边缘设备。在这项工作中,我们评估了代表机器人和边缘设备功能的一系列设备上的Yolo和SSD家族的几个模型架构的延迟和图。我们还评估了运行时框架的效果,并证明了一些意外的largedIfferencesCanbefound.basedonourevaluationsweproposenewvariations yolo-lite体系结构,我们显示的可以在减少潜伏期时提供增加的地图。
主要关键词