可以通过在训练过程中逐步增加图像大小来进一步加速我们的培训。许多以前的作品,例如渐进式调整(Howard,2018),FixRes(Touvron等人,2019年)和混合匹配(Hoffer等人,2019年),在培训中使用了较小的图像尺寸;但是,它们通常对所有图像尺寸保持相同的正则化,从而导致准确性下降。我们认为,对不同图像大小保持相同的规则ization并不理想:对于同一网络,小图像大小会导致小网络小组,因此需要弱的正则化;反之亦然,较大的图像大小需要更强的正则化来对抗过度拟合(请参阅第4.1节)。基于这种见解,我们提出了一种改进的渐进学习方法:在早期的培训时期,我们以较小的图像大小和较弱的正则化(例如,辍学和数据增强)训练网络,然后我们逐渐增加图像大小并增加更强大的调节化。建立在渐进式调整的基础上(Howard,2018),但是通过动态调整正则化,我们的方法可以加快训练而不会导致准确性下降。
主要关键词