人工智能 (AI) 正越来越多地融入科学发现,以增强和加速研究,帮助科学家提出假设、设计实验、收集和解释大型数据集,并获得仅使用传统科学方法可能无法获得的见解。在这里,我们研究了过去十年的突破,包括自监督学习,它允许模型在大量未标记数据上进行训练,以及几何深度学习,它利用有关科学数据结构的知识来提高模型的准确性和效率。生成式人工智能方法可以通过分析包括图像和序列在内的各种数据模式来创建设计,例如小分子药物和蛋白质。我们讨论了这些方法如何在整个科学过程中帮助科学家,以及尽管取得了这些进展,仍然存在的核心问题。人工智能工具的开发人员和用户都需要更好地了解这些方法何时需要改进,以及数据质量差和管理不善所带来的挑战仍然存在。这些问题涉及科学学科,需要开发有助于科学理解或自主获取科学理解的基础算法方法,使它们成为人工智能创新的关键重点领域。