在 TensorFlow Probability 中使用自回归流进行实验

继最近对 TensorFlow Probability (TFP) 中的双射函数的介绍之后,这篇文章将自回归引入了讨论。通过新的 R 包 tfprobability 使用 TFP,我们研究了掩蔽自回归流 (MAF) 的实现,并将其用于两个不同的数据集。

来源:RStudio AI博客

在本系列关于自回归流模型的第一部分中,我们研究了 TensorFlow Probability (TFP) 中的双射函数,并了解了如何使用它们进行采样和密度估计。我们单独挑选了仿射双射函数来演示流构造的机制:我们从易于采样的分布开始,并允许直接计算其密度。然后,我们附加一些可逆变换,优化最终变换分布下的数据似然性。该 (对数) 似然计算的效率是规范化流的优势所在: (未知) 目标分布下的对数似然性是逆变换数据在基础分布下的密度与逆雅可比矩阵的绝对对数行列式之和。

本系列关于自回归流模型的第一部分 双射器 仿射双射器

现在,仿射流很少强大到足以对非线性复杂变换进行建模。相比之下,自回归模型在密度估计和样本生成方面取得了实质性的成功。结合更复杂的架构、特征工程和广泛的计算,自回归的概念已经并将继续推动图像、语音和视频建模等领域的先进架构的发展。

这篇文章将关注 TFP 中自回归流的构建块。虽然我们不会真正构建最先进的模型,但我们会尝试理解和使用一些主要成分,希望能够让读者在自己的数据上进行自己的实验。

用于分布估计的掩蔽自回归流 (Papamakarios、Pavlakou 和 Murray 2017) Papamakarios、Pavlakou 和 Murray 2017

自回归和掩蔽

在分布估计中,自回归通过概率链式法则进入场景,该法则将联合密度分解为条件密度的乘积:

(Germain 等人 2015) \(i\) \(1 ... i-1\)