Loading...
机构名称:
¥ 12.0

我的论文重点关注生成模型及其在离散数据中的应用。我们提出了新颖的算法,将最先进的生成模型的见解与离散数据类型的领域特定知识相结合。这些算法旨在增强与训练数据的属性相似性,提高数据有效性,并提高生成输出的整体质量。我的论文的第一部分研究了使用上下文无关语法将几何图像转换为离散表示。我们讨论了在大型搜索空间中识别合适表示的有效且可扩展的技术。我的论文的第二部分研究了变分自动编码器 (VAE) 在恢复嵌入在低维流形中的高维数据时的行为,评估了它们恢复流形及其上的数据密度的能力。将我们对 VAE 的探索扩展到离散数据领域,特别是在分子数据生成中,我们发现一种增强 VAE 对连续数据的流形恢复的方法也显著改善了离散数据生成。我们使用 ChEMBL 数据集和两个较小的蛋白质靶标活性分子数据集研究了它的优点和局限性。最后,为了解决生成稳定三维分子的难题,该论文将不可微分化学预言机 GFN2-xTB 融入去噪过程,以改善几何形状和稳定性。该方法已在 QM9 和 GEOM 等数据集上得到验证,表明生成的分子具有更高的稳定率。

结构化离散数据的生成模型及其在药物发现中的应用

结构化离散数据的生成模型及其在药物发现中的应用PDF文件第1页

结构化离散数据的生成模型及其在药物发现中的应用PDF文件第2页

结构化离散数据的生成模型及其在药物发现中的应用PDF文件第3页

结构化离散数据的生成模型及其在药物发现中的应用PDF文件第4页

结构化离散数据的生成模型及其在药物发现中的应用PDF文件第5页

相关文件推荐

2024 年
¥5.0