摘要需要很长时间,并且需要大量的努力来发现和开发新药,这需要进行广泛的研究和测试。借助计算技术和数据分析,生物信息学已成为近年来药物发现的有效工具,使研究人员可以更快地找到新药。在这篇综述中,我们研究了生物信息学在药物发现中的作用,包括使用基于配体和结构的药物设计,基于药物团模型的虚拟筛查,基于药物学模型的从头设计以及定量结构 - 活性关系(QSAR)模型和机器学习技术。我们还讨论了来自不同来源的重要数据收集,例如自然和合成数据库,用于支持药物发现工作。我们强调了生物信息学通过对最近的研究的分析来彻底改变药物发现领域的潜力,并加速了新药物来治疗各种疾病。关键字:生物信息学,药物发现,基于配体的药物设计,基于结构的药物设计,虚拟筛查,QSAR,机器学习,数据分类引入药物通过生物信息学发现药物发现
药物诱导的肝损伤(DILI)是由药物引起的严重不良反应,可能导致急性肝衰竭甚至死亡。许多努力集中在减轻与潜在DILI相关的风险上。在其中,定量结构活性关系(QSAR)被证明是早期肝毒性筛查的有价值工具。它的优点不包括对物质物质和快速交付结果的要求。深度学习(DL)最近取得了快速的进步,并已用于开发QSAR模型。本综述讨论了DL在预测DILI中的使用,重点是采用广泛的化学结构数据集及其相应的DILI结果的QSAR模型的开发。我们对各种DL方法进行了全面的评估,与传统机器学习(ML)方法相比,并探讨了DL技术在其可解释性,可伸缩性和概括性方面的优势和局限性。总体而言,我们的综述强调了DL方法的潜力增强DILI预测,并为未来的途径提供了开发预测模型以减轻人类稀有风险的见解。
摘要阿尔茨海默氏病(AD)是一种神经退行性疾病,其特征是认知能力下降,β-淀粉样蛋白(Aβ)斑块的积累在其进展中起关键作用。β-分泌酶1(BACE1)是Aβ产生的关键酶,使其成为AD治疗的主要治疗靶标。但是,由于选择性差和血脑屏障的渗透性有限,设计有效的BACE1抑制剂一直在挑战。为了应对这些挑战,我们在定量结构活性关系(QSAR)模型中使用支持向量回归(SVR)采用了机器学习方法来预测潜在的BACE1抑制剂的抑制活性。我们的模型在Chembl数据库的7,298种化合物的数据集上训练,使用分子描述符准确地预测了PIC 50值,在测试集中实现了R²为0.690。该模型的性能证明了其在优先考虑候选药物的优先级方面的实用性,可能会加速药物发现。这项研究强调了计算方法在优化药物发现方面的有效性,并表明进一步的完善可以增强该模型对AD疗法的预测能力。
研究以定量结构性质关系(QSPR)分析为中心,重点是各种图能量,研究了诸如Me-氯喹酮,Sertraline,Sertraline,Niclosamide,Tizoxanide,Pha-690509,Irricasan,Emricasan,Emricasan和Sofosbuvir等药物。采用计算建模技术,旨在发现这些药物的化学结构及其独特特性之间的相关性。结果阐明了结构特征和药理学特征之间的定量关系,从而提高了我们的预测能力。这项研究显着,通过对这些药用化合物的结构质质连接提供基本见解,从而有助于药物发现和设计。值得注意的是,某些基于光谱的描述符,例如正惯性能,邻接能量,算术几何能,第一个Zegrab能量和谐波指数,表现出高于0.999的强相关系数。相反,众所周知的描述符,例如扩展的邻接,拉普拉斯和无价的拉普拉斯光谱半径,以及第一个和第二个Zagreb estrada指数的性能较弱。文章强调了图形能量和线性回归模型的应用,以有效预测药理特征,通过阐明分子结构与药理特征之间的关系来有效地增强药物发现过程并帮助有针对性的药物设计。
摘要:药物发现的一个核心问题是确定类药物化合物与蛋白质靶标之间的相互作用。在过去的几十年中,已经开发了各种定量结构-活性关系 (QSAR) 和蛋白质化学计量 (PCM) 方法来建模和预测这些相互作用。虽然 QSAR 方法仅利用药物化合物的表示,但 PCM 方法结合了蛋白质靶标和药物化合物的表示,使它们能够对以前未见过的蛋白质靶标实现高于偶然性的预测准确度。QSAR 和 PCM 方法最近都通过机器学习和深度神经网络得到了改进,从而允许从测量数据开发药物-靶标相互作用预测模型。然而,深度神经网络通常需要大量的训练数据,并且无法稳健地适应新任务,例如在推理时预测未见过的蛋白质靶标的相互作用。在这项工作中,我们建议使用超网络在推理过程中有效地在任务之间传输信息,从而准确预测药物-靶标对未见过的蛋白质靶标的相互作用。与之前的方法相比,我们的 HyperPCM 方法在多个知名基准(包括 Davis、DUD-E 和 ChEMBL 衍生的数据集)上达到了最先进的性能,并且在涉及看不见的蛋白质靶标的零样本推理方面尤其出色。 我们的方法以及可重复的数据准备可在 https://github.com/ml-jku/hyper-dti 上获得。■ 简介药物 - 靶标相互作用 1 的建模是药物发现的一个基本步骤,意味着学习小的类药物化合物(在此称为药物化合物(术语药物化合物在本文中表示配体,即分子化合物,被视为潜在药物但最终可能不适合作为最终候选药物))与已确定的疾病蛋白质靶标之间相互作用的结合特性。2 随着新疾病的出现,迫切需要快速准确地预测大量药物 - 靶标相互作用。 3 药物-靶标相互作用的计算机建模受益于更强大的计算能力 4 ,而使用其他领域的最先进深度学习方法则有助于进一步发展。 5、6 到目前为止,该领域的研究主要集中在药物化合物和蛋白质靶标的表示上。 传统的定量结构-活性关系 (QSAR) 模型 7 仅基于药物化合物结构的表示来学习药物-靶标相互作用的特性。 通常,首先将结构编码为数值向量,即嵌入。 手工嵌入可以从化学和生物数据 8-10 或通过位向量(例如摩根指纹)构建。 11
摘要简介:人工智能 (AI) 启发了计算机辅助药物发现。机器学习(尤其是深度学习)在多个科学学科中的广泛应用,以及计算硬件和软件的进步等因素继续推动这一发展。对于人工智能在药物发现中的应用,最初的大部分怀疑已经开始消失,从而使药物化学受益。涵盖的领域:回顾了人工智能在化学信息学中的现状。本文讨论的主题包括定量结构-活性/性质关系和基于结构的建模、从头分子设计和化学合成预测。强调了当前深度学习应用的优势和局限性,并展望了用于药物发现的下一代人工智能。专家意见:基于深度学习的方法才刚刚开始解决药物发现中的一些基本问题。某些方法上的进步,例如信息传递模型、空间对称性保持网络、混合从头设计和其他创新的机器学习范式,可能会变得很普遍,并有助于解决一些最具挑战性的问题。开放数据共享和模型开发将在利用人工智能推动药物发现方面发挥核心作用。
摘要简介:人工智能 (AI) 启发了计算机辅助药物发现。机器学习(尤其是深度学习)在多个科学学科中的广泛应用,以及计算硬件和软件的进步等因素继续推动这一发展。关于人工智能在药物发现中的应用的最初怀疑态度已开始消失,从而使药物化学受益。涵盖的领域:回顾了人工智能在化学信息学中的现状。本文讨论的主题包括定量结构-活性/性质关系和基于结构的建模、从头分子设计和化学合成预测。重点介绍了当前深度学习应用的优势和局限性,以及对用于药物发现的下一代人工智能的看法。专家意见:基于深度学习的方法才刚刚开始解决药物发现中的一些基本问题。某些方法上的进步,例如消息传递模型、空间对称性保持网络、混合从头设计和其他创新机器学习范式,可能会变得很普遍,并有助于解决一些最具挑战性的问题。开放数据共享和模型开发将在人工智能药物发现的进步中发挥核心作用。
由小有机化合物引起的分析干扰继续对早期药物发现构成巨大挑战。已经开发了各种计算方法来识别可能引起测定干扰的化合物。但是,由于可用于模型开发的数据稀缺,这些方法的预测准确性和适用性受到限制。在这项工作中,我们介绍了E-Guard(专家指导的鲁棒干扰复合检测的增强),这是一个新颖的框架,试图通过整合自我介绍,积极的学习和专家指导的分子产生来解决数据稀缺和失衡。e-guard迭代地用与干扰相关的分子丰富了训练数据,从而产生了具有出色性能的定量结构交流关系(QSIR)模型。我们以四个高质量数据集,氧化还原反应性,纳米酸酯酶抑制和萤火虫荧光素酶抑制的示例,证明了电子方形的实用性。与未经e-Guard数据增强的模型相比,这些数据集的MCC值最高为0.47,其富集因子的改进有两个或更高。这些结果突出了电子保守物作为缓解早期药物发现中测定干扰的可扩展解决方案的潜力。
由小有机化合物引起的分析干扰继续对早期药物发现构成巨大挑战。已经开发了各种计算方法来识别可能引起测定干扰的化合物。但是,由于可用于模型开发的数据稀缺,这些方法的预测准确性和适用性受到限制。在这项工作中,我们介绍了E-Guard(专家指导的鲁棒干扰复合检测的增强),这是一个新颖的框架,试图通过整合自我介绍,积极的学习和专家指导的分子产生来解决数据稀缺和失衡。e-guard迭代地用与干扰相关的分子丰富了训练数据,从而产生了具有出色性能的定量结构交流关系(QSIR)模型。我们以四个高质量数据集,氧化还原反应性,纳米酸酯酶抑制和萤火虫荧光素酶抑制的示例,证明了电子方形的实用性。与未经e-Guard数据增强的模型相比,这些数据集的MCC值最高为0.47,其富集因子的改进有两个或更高。这些结果突出了电子保守物作为缓解早期药物发现中测定干扰的可扩展解决方案的潜力。
摘要。材料的腐蚀在各个行业构成了重大挑战,从而产生了重大的经济影响。在这种情况下,嘧啶化合物出现是有希望的,无毒的,具有成本效益和多功能腐蚀抑制剂的。然而,识别这种抑制剂的常规方法通常是时必时间的,昂贵的且劳动力密集的。应对这一挑战,我们的研究利用机器学习(ML)预测嘧啶化合物化合物腐蚀抑制效率(CIE)。使用定量结构 - 特性关系(QSPR)模型,我们比较了14个线性和12种非线性ML算法来识别CIE的最准确预测指标。装袋回归模型表现出卓越的性能,达到均方根误差(RMSE)为5.38,均方根误差(MSE)为28.93,平均绝对误差(MAE)为4.23,平均绝对百分比误差(MAPE)为0.05,以预测吡啶胺化合物的CIE值。这项研究标志着腐蚀科学的显着进步,提供了一种新型,有效的基于ML的方法,可替代传统的实验方法。它表明机器学习可以快速,准确地确定有机化学抑制剂(如嘧啶止材料腐蚀)的良好状态。这种方法为行业提供了一种新的观点和可行的解决方案,以解决已经存在的问题。