货币等值(截至 2006 年 11 月 10 日) 货币单位:非洲金融共同体法郎 UA1 = 1.4898 美元 UA1 = 762.46 非洲金融共同体法郎 1 美元 = 510.85 非洲金融共同体法郎 预算年度 1 月 1 日 – 12 月 31 日 首字母缩略词和缩写 ACDA 中非农业发展署 ACFPE 中央培训和就业署 ADECAF 家庭咖啡生产发展署 ANEAC 中非民族企业家和工匠协会 ASYCUDA 海关数据自动化系统 BEAC 中非国家银行 BECDOR 钻石和黄金评估和管理局 BICA 中非国际银行 BIVAC 检查估价评估和管理局 BMPC 摩洛哥-中非人民银行 BSIC 萨赫勒-撒哈拉银行 CAISTAB 农业出口价格稳定与均衡基金CAR 中非共和国 CBCA 商业银行 Centrafrique CCIMA 工商矿业手工业商会 UNPC CCJA 共同法院和仲裁院 CEEAC 中非国家经济共同体 CEMAC 中非经济和货币共同体 CEN-SAD 萨赫勒-撒哈拉国家共同体 CFDT 法国纺织纤维发展公司 COMESA 东部和南部非洲共同市场 DGSEES 统计、社会和经济研究总司 DTIS 诊断性贸易一体化研究 EPA 经济伙伴关系协定 ESPF 经济和社会政策框架文件 FEPUCA 中非生产者与使用者联合会 GDP 国内生产总值 GICA 中非跨行业小组 GIR 农村利益集团 ICAO 国际民用航空组织 ICO 国际咖啡组织 ICRA 中非农艺研究所 IFWG 综合框架工作组 ILO 国际劳工组织 IMF 国际货币基金组织
药物-靶标相互作用 (DTI) 预测是药物再利用领域中一项相关但具有挑战性的任务。计算机模拟方法引起了特别的关注,因为它们可以降低传统方法的相关成本和时间投入。然而,当前最先进的方法存在几个局限性:现有的 DTI 预测方法在计算上成本高昂,从而阻碍了使用大型网络和利用可用数据集的能力,并且 DTI 预测方法对未见数据集的推广仍未探索,这可能会在准确性和稳健性方面改善 DTI 推断方法的开发过程。在这项工作中,我们介绍了 GE NN IUS(图嵌入神经网络相互作用发现系统),这是一种基于图神经网络 (GNN) 的方法,在各种数据集的准确性和时间效率方面均优于最先进的模型。我们还通过评估每个数据集中以前未知的 DTI 展示了其发现新相互作用的预测能力。我们通过在不同数据集上训练和测试 GE NN IUS 进一步评估了其泛化能力,结果表明该框架可以通过在大型数据集上训练并在较小的数据集上测试来潜在地改进 DTI 预测任务。最后,我们定性地研究了 GE NN IUS 生成的嵌入,发现 GNN 编码器在图卷积之后保留了生物信息,同时通过节点传播这些信息,最终在节点嵌入空间中区分蛋白质家族。
药物-靶蛋白相互作用 (DTI) 识别对于药物发现和药物重新定位至关重要,因为治疗药物会作用于致病蛋白。然而,DTI 识别过程通常需要昂贵且耗时的任务,包括涉及大量候选化合物的生物实验。因此,已经开发了各种计算方法。在众多可用方法中,基于化学基因组学特征的方法引起了广泛关注。这些方法计算药物和蛋白质的特征描述符作为输入数据来训练机器和深度学习模型,以便准确预测未知的 DTI。此外,已经提出了基于注意力的学习方法来识别和解释 DTI 机制。然而,需要改进以增强预测性能和 DTI 机制阐明。为了解决这些问题,我们开发了一种基于注意力的方法,称为可解释交叉注意力网络 (ICAN),它使用药物和靶蛋白氨基酸序列的简化分子输入行输入系统来预测 DTI。我们通过探索交叉注意力或自注意力、注意力层深度以及注意力机制中上下文矩阵的选择来优化注意力机制架构。我们发现,一种解码药物相关蛋白质上下文特征而无需任何蛋白质相关药物上下文特征的简单注意力机制有效地实现了高性能。ICAN 在多个方面优于最先进的方法,并以统计意义揭示了交叉注意力权重中的一些加权位点代表实验结合位点,从而证明了结果的高度可解释性。
摘要:在药物发现过程中,确定最佳候选药物非常重要。生物学和计算科学领域的研究人员一直试图利用机器学习 (ML) 来有效预测药物-靶标相互作用 (DTI)。近年来,根据预训练模型在自然语言处理 (NLP) 中的新兴用途,人们正在为化合物和靶蛋白开发预训练模型。本研究试图使用 Transformers (BERT) 预训练模型 ChemBERTa 来改进化合物的 DTI 预测模型。预训练的特点是使用简化的分子输入线路输入系统 (SMILES)。我们还使用预训练的 ProBERT 来预测靶蛋白(预训练使用氨基酸序列)。BIOSNAP、DAVIS 和 BindingDB 数据库 (DB) 被用于(单独或一起)学习。最终模型由 ChemBERTa 和 ProtBert 以及集成的 DB 共同教授,与之前的模型相比,根据受试者工作特征曲线下面积 (AUC) 和精确召回率-AUC 值,提供了迄今为止最佳的 DTI 预测性能。使用对 13 对底物和代谢酶细胞色素 P450 (CYP) 的特定案例研究验证了最终模型的性能。最终模型提供了出色的 DTI 预测。由于药物和靶蛋白之间的现实世界相互作用预计会表现出特定的模式,因此使用 ChemBERTa 和 ProtBert 进行预训练可以教授此类模式。如果学习采用涵盖药物和靶蛋白之间所有关系的大型、均衡的数据集,学习此类相互作用的模式将提高 DTI 准确性。
药物-靶标相互作用 (DTI) 的发现是一个非常有前途的研究领域,具有巨大的潜力。通过计算方法准确识别药物和蛋白质之间的可靠相互作用,通常利用从不同数据源检索到的异构信息,可以促进有效药物的开发。尽管随机游走和矩阵分解技术在 DTI 预测中被广泛使用,但它们有几个局限性。基于随机游走的嵌入生成通常以无监督的方式进行,而矩阵分解中的线性相似性组合会扭曲不同观点提供的个体见解。为了解决这些问题,我们采用多层网络方法来处理不同的药物和靶标相似性,并提出了一种新的优化框架,称为基于多相似性 DeepWalk 的矩阵分解 (MDMF),用于 DTI 预测。该框架统一了嵌入生成和交互预测,学习药物和靶标的向量表示,不仅可以在所有超层中保持高阶接近度和层特定的局部不变性,还可以近似其内积的相互作用。此外,我们开发了一种集成方法 (MDMF2A),该方法集成了 MDMF 模型的两个实例,分别优化了精确召回曲线下面积 (AUPR) 和受试者工作特征曲线下面积 (AUC)。对现实世界 DTI 数据集的实证研究表明,我们的方法在四种不同设置中实现了比当前最先进的方法具有统计显著改进。此外,对高排名非相互作用对的验证也证明了 MDMF2A 发现新型 DTI 的潜力。
动机:使用人类表型数据预测药物-靶标相互作用 (DTI) 有可能消除动物实验和人类临床结果之间的转化差距。人类表型驱动的 DTI 预测的一个挑战是整合和建模不同的药物和疾病表型关系。利用大量临床观察到的药物和疾病表型以及 7200 万患者的电子健康记录 (EHR),我们通过无缝结合 DTI 预测和临床证实,开发了一种新颖的集成计算药物发现方法。结果:我们通过建模 1430 种药物、4251 种副作用、1059 种疾病和 17860 个基因之间的 855904 种表型和遗传关系,开发了一个基于网络的 DTI 预测系统 (TargetPredict)。我们对 TargetPredict 进行了从头交叉验证系统评估,并将其与最先进的表型驱动的 DTI 预测方法进行了比较。我们应用 TargetPredict 来确定阿尔茨海默病 (AD) 的新型重新定位候选药物,阿尔茨海默病在美国影响了 580 多万人。我们使用超过 7200 万患者的 EHR 评估了顶级重新定位候选药物的临床有效率。当使用 910 种药物进行评估时,从头交叉验证中的受试者工作特征 (ROC) 曲线下面积为 0.97。TargetPredict 的表现优于最先进的表型驱动的 DTI 预测系统,这通过精确度-召回率曲线衡量[通过平均精确度 (MAP) 衡量:0.28 比 0.23,P 值 < 0.0001]。基于 EHR 的病例对照研究发现,处方中排名靠前的重新定位药物与 AD 诊断风险降低显著相关。例如,我们发现,利拉鲁肽(一种 2 型糖尿病药物)的处方与 AD 诊断风险降低显著相关 [调整后的优势比 (AOR):0.76;95% 置信区间 (CI) (0.70, 0.82),P 值 < 0.0001]。总之,我们的综合方法无缝结合了计算 DTI 预测和基于 EHR 的大规模患者临床确证,在快速识别复杂疾病的新药物靶点和候选药物方面具有很高的潜力。可用性和实施:nlp.case.edu/public/data/TargetPredict。联系方式:rxx@case.edu
目前,DTI 预测的计算方法可以分为三类:基于配体的方法、对接方法和特征学习方法。基于配体的方法通常用于通过计算给定药物或化合物与已知靶标的活性化合物的化学结构相似性来估计潜在的作用靶标。Keiser 等人 [3] 提出了一种根据配体的化学相似性推断蛋白质靶标的方法。Yamanishi 等人 [7-9] 通过将化合物的化学结构相似性和蛋白质的氨基酸序列相似性整合到均匀空间来预测未知的药物-靶标相互作用。Campillos 等人 [9] 将化合物的化学结构相似性和蛋白质的氨基酸序列相似性整合到均匀空间中。 [6]通过表型副作用的相似性来预测潜在的靶标蛋白。这种基于配体的方法在化学结构相似性较高的情况下简单有效,但也在很大程度上限制了其应用的范围和准确性。对接方法是计算药物与潜在靶标在三维结构中的形状和电性匹配程度,从而推断药物可能的作用靶点。其中,反向对接方法是最常用的预测方法,该方法通过预测给定化合物与靶标之间的相互作用模式和亲和力对药物靶标进行排序,从而确定该药物的可能靶点。程等[10]开发了基于结构的最大亲和力模型。李等[11]开发了利用对接方法识别药物靶点的网络服务器Tar-FisDock。此类方法充分考虑了目标蛋白质的三维结构信息,但分子对接方法本身仍存在一些尚未得到有效解决的问题,如蛋白质的灵活性、打分函数的准确性以及溶剂水分子等,导致逆对接,该方法的预测准确率较低。对接的另一个严重问题是它不能应用于三维结构未知的蛋白质,到目前为止,已知三维结构的蛋白质仍只占所有蛋白质的一小部分,这严重限制了该方法的推广和普及。特征学习方法将药物靶标关系视为相互作用和非相互作用的二类问题,此类方法利用机器学习算法学习已知化合物-靶标对的潜在模式,通过迭代优化生成预测模型,进而推断潜在的DTI。Yu等[12]提出了一种基于化学、基因组和药理学信息的系统方法。Faulon等[13]提出了一种基于化学、基因组和药理学信息的系统方法。[ 13 ] 预测药物