Loading...
机构名称:
¥ 1.0

摘要。今天的深度学习方法着重于如何设计目标函数以使预测尽可能接近目标。同时,必须设计适当的神经网络体系结构。现有方法忽略一个事实,即当输入数据逐层特征转换时,会丢失大量信息。本文深入研究了信息瓶颈和可逆功能的重要问题。我们提出了可编程梯度信息(PGI)的概念,以应对深网所需的各种更改以实现多个目标。PGI可以为目标任务提供完整的输入信息来计算目标函数,以便可以获取可靠的梯度信息以更新网络参数。此外,设计了轻巧的网络体系结构 - 一般有效的层聚合网络(GELAN)。Gelan确认PGI在轻量级模型上取得了卓越的成绩。我们在MS可可对象检测数据集上验证了所提出的Gelan和PGI。结果表明,与基于深度卷积开发的状态方法相比,Gelan仅使用常规召集操作员来实现更好的参数利用。PGI可用于从轻量级到大型的各种型号。它可用于获取完整的信息,因此,与使用大型数据集进行预训练的最新模型可以实现训练范围的模型,比较结果如图1。源代码在https://github.com/wongkinyiu/yolov9上发布。

Yolov9:使用可编程梯度信息学习要学习的内容

Yolov9:使用可编程梯度信息学习要学习的内容PDF文件第1页

Yolov9:使用可编程梯度信息学习要学习的内容PDF文件第2页

Yolov9:使用可编程梯度信息学习要学习的内容PDF文件第3页

Yolov9:使用可编程梯度信息学习要学习的内容PDF文件第4页

Yolov9:使用可编程梯度信息学习要学习的内容PDF文件第5页