本文介绍了Barlowrl,这是一种具有数据效率增强的学习代理,它与Barlow Twins一起使用DER(数据有效的雨弓)算法进行了自我监督的学习框架。barlowrl在Atari 100k基准上均优于DER及其对比度卷曲。barlowrl通过强制传播到整个空间来避免尺寸崩溃。这有助于RL算法利用统一扩散状态表示,最终导致表现出色。Barlow双胞胎与DER的集成增强了数据效率,并在RL任务中实现了卓越的性能。Barlowrl展示了合并自我监督的学习技术,尤其是非对抗性目标的潜力,以改善RL算法。关键词:深度强化学习;自学学习;数据效率
合成图生成器(SGG)的主题最近由于生成建模的最新突破而引起了很多关注。但是,许多与图形尺寸相比,许多最先进的SGG并不能很好地扩展。的确,在生成过程中,通常必须考虑固定数量的节点的所有可能边,其中缩放在O(n 2)中,n是图中的节点的数量。因此,许多最新的SGG不适用于大图。在本文中,我们提出了Sangea,这是一个较大的合成图生成框架,可扩展任何SGG对大图的适用性。首先将大图拆分为社区,Sangea每个社区训练一个SGG,然后将社区图形链接在一起以创建合成的大图。我们的实验表明,就拓扑和节点特征分布而言,Sangea生成的图与原始图具有很高的相似性。此外,这些生成的图在下游任务(例如链接预测)上实现了高实用性。最后,我们对生成的图表进行了隐私评估,以表明即使它们具有出色的实用程序,它们也达到了合理的隐私分数。关键字:图生成学习; gnns,属性生成;可伸缩性;隐私