Loading...
机构名称:
¥ 1.0

动物视觉感知是一种重要的技术,用于监测动物健康,了解动物行为并协助与动物有关的研究。然而,设计一个基于深度学习的感知模型,该模型可以自由地跨各种感知任务自由地适应不同动物,这是由于大量动物的不同姿势,缺乏对稀有物种的数据以及不同任务的半偏见不一致。我们介绍了Uniap,这是一种新型的通用动物感知模型,该模型利用了很少的射击学习来实现各种视觉任务之间的跨物种感知。我们提出的模型将支持图像和标签作为查询图像的及时指导。图像和标签分别通过基于变压器的编码器和轻质标签编码来处理。然后,匹配模块设计用于汇总及时指导和查询图像之间的信息,然后是多头标签解码器,以生成各种任务的输出。通过利用不同动物和任务之间的共同视觉特征,Uniap可以将知识从良好的物种转移到具有有限标记的数据甚至看不见的物种的物种。我们通过对多种动物物种的姿势估计,分割和分类任务进行全面实验,证明了UNIAP的有效实验,展示了其具有最小标记示例的新阶级和适应新类的能力。

UNIAP:通过几次学习在视觉中迈向普遍的动物感知

UNIAP:通过几次学习在视觉中迈向普遍的动物感知PDF文件第1页

UNIAP:通过几次学习在视觉中迈向普遍的动物感知PDF文件第2页

UNIAP:通过几次学习在视觉中迈向普遍的动物感知PDF文件第3页

UNIAP:通过几次学习在视觉中迈向普遍的动物感知PDF文件第4页

UNIAP:通过几次学习在视觉中迈向普遍的动物感知PDF文件第5页

相关文件推荐