近年来,深度学习和基于人工智能的分子信息学发展迅猛。AlphaFold 的成功引发了人们对将深度学习应用于多个子领域的兴趣,包括合成化学的数字化转型、从科学文献中提取化学信息以及基于天然产物的药物发现中的人工智能。人工智能在分子信息学中的应用仍然受到这样一个事实的限制:用于训练和测试深度学习模型的大多数数据都不是 FAIR 和开放数据。随着开放科学实践越来越受欢迎,FAIR 数据运动、开放数据和开源软件等举措应运而生。对于分子信息学领域的研究人员来说,拥抱开放科学并提交支持其研究的数据和软件变得越来越重要。随着开源深度学习框架和云计算平台的出现,学术研究人员现在能够轻松部署和测试自己的深度学习算法。随着深度学习的新硬件和更快硬件的发展,以及数字研究数据管理基础设施的不断增加,以及促进开放数据、开源和开放科学的文化,人工智能驱动的分子信息学将继续发展。本综述探讨了分子信息学中开放数据和开放算法的现状,以及未来可以改进的方法。
主要关键词