药物发现是一项复杂的工作,需要在广阔且不断增长的化学领域中找出既安全又有效的治疗化合物。用于识别药物的高通量筛选系统已基本被合理的药物发现所取代,使用专家设计的机器学习算法来协助识别药物、确定靶标优先级和优化先导化合物。然而,临床试验成功率持续较低,导致药物开发成本居高不下。本综述概述了机器学习在小分子临床前药物发现中的历史,并强调了药理学、生物信息学和人工智能 (AI) 的并行进步如何融合在一起,创造出高效的人工智能药物发现工具。更具体地说,生物学已经通过现代方法实现数字化,用于多组学数据收集。多组学数据代表了来自 DNA(基因组学)、RNA(转录组学)、蛋白质(蛋白质组学)、代谢物(代谢组学)和脂质(脂质组学)的生物标志物的深入收集。这些不同的数据集可以通过神经网络组合起来,并与隐马尔可夫模型相链接,从而创建一个相互作用组,试图在基于计算机的算法中模拟人类系统生物学。Transformer 驱动的深度学习模型的集成通过克服药物发现还原策略的局限性,进一步改善了这些系统。随着定制的深度学习架构越来越多地被采用,人工智能驱动的预测生物学将继续改进,并很快成为药物开发的支柱。
主要关键词