Loading...
机构名称:
¥ 1.0

尽管分子表示学习最近取得了进展,但其有效性还是在近世界的假设上假定的,即训练和测试图来自相同的分布。开放世界测试数据集通常与分布(OOD)样本混合在一起,在该样本中,部署的模型将难以做出准确的预测。在药物筛查或设计中分子特性的误导性估计会导致湿lab资源的大量浪费并延迟发现新疗法的发现。传统检测方法需要对OOD检测和分布(ID)分类性能进行贸易,因为它们共享相同的表示模型。在这项工作中,我们建议通过采用基于辅助扩散模型的框架来解析OOD分子,该框架比较了输入分子和重建图之间的相似性。由于产生构建ID训练样品的产生偏见,OOD分子的相似性得分将要低得多以促进检测。尽管在概念上很简单,但将此香草框架扩展到实际检测应用程序仍然受到两个重大挑战的限制。首先,基于欧几里得距离的流行相似性指标无法考虑复杂的图形结构。第二,涉及迭代脱氧步骤的属性模型众所周知,尤其是在大量药物库上运行时。为了应对这些挑战,我们的研究先驱者是一种旋转型G raph r生态建构的方法,该方法被称为pgr-mood。具体来说,PGR-MOOD取决于三个创新:i)一个有效的指标,可根据离散的边缘和连续节点特征全面量化输入和重建分子的匹配程度; ii)构建

在分子图中优化OOD检测

在分子图中优化OOD检测PDF文件第1页

在分子图中优化OOD检测PDF文件第2页

在分子图中优化OOD检测PDF文件第3页

在分子图中优化OOD检测PDF文件第4页

在分子图中优化OOD检测PDF文件第5页