摘要 - 由于物流和仓储环境中的广泛应用,垃圾箱包装问题(BPP)最近引起了热情的研究兴趣。真正必须优化垃圾箱以使更多对象被包装到框中。对象包装顺序和放置策略是BPP的两个关键优化目标。但是,BPP的现有优化方法,例如遗传算法(GA),是高度计算成本的主要问题,准确性相对较低,因此在现实的情况下很难实施。为了很好地缓解研究差距,我们提出了一种新颖的优化方法,用于通过深度增强学习(DRL)定期形状的二维(2D)-BPP和三维(3D)-BPP,最大程度地利用空间,并最大程度地减少盒子的使用数量。首先,提出了由编码器,解码器和注意模块组成的修改指针网络构建的端到端DRL神经网络,以达到最佳对象包装顺序。第二,符合自上而下的操作模式,基于高度图的放置策略用于在框中排列有序的对象,从而防止对象与盒子中的盒子和其他对象碰撞。第三,奖励和损失功能被定义为基于对政治演员批评的框架进行培训的紧凑性,金字塔和用法数量的指标。最后,实施了一系列实验,以将我们的方法与常规的包装方法进行比较,我们从中得出结论,我们的方法在包装精度和效率方面都优于这些包装方法。
主要关键词