Loading...
机构名称:
¥ 1.0

多标签多视图动作识别旨在识别来自多个摄像机限制的未修剪视频的多个同时或顺序动作。现有工作集中在狭窄区域中具有强标签的狭窄区域中的多视图动作识别,其中每个动作的发作和偏移都在框架级别标记。这项研究重点介绍了分布摄像机以捕获宽范围区域的现实情况,在视频级别上只能使用弱标签。我们提出了一种名为Multi -Vilew A Ction S选举L(MultiAsl)的方法,该方法通过从不同的观点中选择最有用的信息来利用操作分别学习来增强视图融合。所提出的方法包括多视图时空变压器视频编码器,以从多视频视频中提取空间和时间特征。动作选择学习是在框架级别采用的,使用从视频级别的弱标签获得的伪基真实,以识别最相关的框架以供行动识别。使用MM-Office数据集在现实世界办公室环境中进行了实验,证明了与现有方法相比,该方法的出色性能。

多标签多视图动作识别的动作选择学习

多标签多视图动作识别的动作选择学习PDF文件第1页

多标签多视图动作识别的动作选择学习PDF文件第2页

多标签多视图动作识别的动作选择学习PDF文件第3页

多标签多视图动作识别的动作选择学习PDF文件第4页

多标签多视图动作识别的动作选择学习PDF文件第5页

相关文件推荐

2023 年
¥3.0
2023 年
¥1.0