新算法使用对称数据启用有效的机器学习

这种新方法可能会导致增强的药物和材料发现模型。

来源:MIT新闻 - 人工智能

如果您旋转分子结构的图像,人类可以告诉旋转图像仍然是相同的分子,但是机器学习模型可能认为这是一个新的数据点。在计算机科学的说法中,该分子是“对称的”,这意味着该分子的基本结构在经历某些转换(例如旋转)时保持不变。

如果药物发现模型不了解对称性,则可能会对分子特性做出不准确的预测。但是,尽管取得了一些经验的成功,但尚不清楚是否有一种计算有效的方法来训练一个可以保证尊重对称性的良好模型。麻省理工学院研究人员的一项新研究回答了这个问题,并展示了对对称性的第一种机器学习方法,该方法在计算和数据量方面是可以有效地有效的。

这些结果阐明了一个基本问题,他们可以帮助研究人员开发旨在处理对称性的更强大的机器学习模型。从发现新材料到识别天文异常到揭示复杂的气候模式,此类模型将在各种应用中有用。

“这些对称性很重要,因为它们是大自然正在向我们讲述数据的某种信息,我们应该在机器学习模型中考虑到它。我们现在已经证明,可以有效地使用对称数据进行机器学习,” MIT研究生学生和这项研究的共同领导作者Behrooz Tahmasebi说。

研究对称性

对称数据出现在许多领域,尤其是自然科学和物理学。例如,识别对称性的模型能够识别对象,例如汽车,无论该对象在何处将其放置在图像中。

但是训练模型处理对称数据并非易事。

在这一理论评估中构建,研究人员设计了一种使用对称数据的机器学习的有效算法。