Loading...
机构名称:
¥ 2.0

摘要 视觉系统使用对物体的选择性瞥见序列来支持行为目标,但这种注意力控制是如何学习的呢?在这里,我们提出了一个编码器-解码器模型,该模型的灵感来自大脑中构成识别-注意系统的自下而上和自上而下的视觉通路。在每次迭代中,都会从图像中获取一个新的瞥见,并通过“什么”编码器(前馈、循环和胶囊层的层次结构)进行处理,以获得以对象为中心(对象文件)的表示。该表示被馈送到“哪里”解码器,其中不断发展的循环表示提供自上而下的注意力调节以规划后续的瞥见并影响编码器中的路由。我们展示了注意力机制如何显著提高对高度重叠数字进行分类的准确性。在需要比较两个对象的视觉推理任务中,我们的模型实现了近乎完美的准确性,并且在推广到看不见的刺激方面明显优于更大的模型。我们的工作证明了基于对象的注意力机制对对象进行连续观察的好处。

一种受大脑启发的基于对象的注意力网络,用于多...

一种受大脑启发的基于对象的注意力网络,用于多...PDF文件第1页

一种受大脑启发的基于对象的注意力网络,用于多...PDF文件第2页

一种受大脑启发的基于对象的注意力网络,用于多...PDF文件第3页

一种受大脑启发的基于对象的注意力网络,用于多...PDF文件第4页

一种受大脑启发的基于对象的注意力网络,用于多...PDF文件第5页

相关文件推荐

2025 年
¥1.0
2023 年
¥3.0
2025 年
¥1.0
2022 年
¥1.0
2021 年
¥2.0
2024 年
¥1.0