鲍曼不动杆菌是一种世界范围内分布的高耐药率革兰氏阴性细菌,是造成多种医院内感染的元凶。我们应用计算化学基因组学框架来研究将已获批准的药物重新用于治疗鲍曼不动杆菌。这种综合方法包括汇编和准备蛋白质组学数据、识别药物-靶标数据库中的同源蛋白、评估靶标的进化保守性、进行分子对接研究和体外试验。我们选取了七种药物进行实验测定。其中,他伐硼罗表现出最有希望的抗菌活性,最低抑菌浓度 (MIC) 值为 2 μ g/ml,对几种临床相关菌株具有强效活性,在 16 μ g/ml 浓度下对多重耐药菌株的生物膜具有强大的功效。分子对接研究阐明了他伐硼罗在亮氨酰-tRNA 合成酶的编辑和活性域中的结合模式,从而深入了解了其抗菌活性的结构基础。他伐硼罗有望成为一种对抗鲍曼不动杆菌感染的抗菌剂,值得在临床前研究中进一步研究。
数据分析 使用 Intogen 框架的详细信息和代码可在此处获得 (https://intogen.readthedocs.io/en/latest/index.html)。执行此分析的具体代码可在 Genomics England 研究环境中的 /re_gecip/shared_allGeCIPs/pancancer_drivers/ code/ 下找到。成为 Genomics England 研究网络成员并获得访问权限的链接可在此处找到 https:// www.genomicsengland.co.uk/research/academic/join-gecip。执行 canSAR 化学基因组学分析的代码可通过 Zenodo (https://zenodo.org/record/8329054) 获得。使用的其他软件包/软件:VerifyBamID v1.1.3 = https://github.com/statgen/verifyBamID Ccube v1 = https://github.com/keyuan/ccube Isaac aligner v03.16.02.19 = https://github.com/Illumina/Isaac3 Strelka v2.4.7 = https://github.com/Illumina/strelka bcftools v1.9 = https://samtools.github.io/bcftools/bcftools.html alleleCount-FixVAF v4.1.0 = https://github.com/danchubb/alleleCount-FixVAF VEP v101 = https://github.com/Ensembl/ensembl-vep CADD v1.6 = https://github.com/kircherlab/CADD-scripts/ OncoKb v3.11 = https://www.oncokb.org/api-access trackViewer v1.38.2 = https://github.com/jianhong/trackViewer mSINGS = https://bitbucket.org/uwlabmed/msings/src/master/ HRDetect = https://github.com/eyzhao/hrdetect-pipeline
大量积累的药物基因组学、化学基因组学和副作用数据集为药物反应预测、药物靶标识别和药物副作用预测提供了前所未有的机会。现有的计算方法将其范围限制在这三个任务中的一项,不可避免地忽略了它们之间的丰富联系。在这里,我们提出了 DrugOrchestra,这是一个深度多任务学习框架,可以联合预测药物反应、靶标和副作用。DrugOrchestra 利用预先训练的基于分子结构的药物表征来连接这三个任务。DrugOrchestra 不是直接对单个任务进行微调,而是使用深度多任务学习通过同时对药物反应、靶标和副作用预测进行微调来获得基于表型的药物表征。通过将这三个任务结合在一起,DrugOrchestra 能够仅通过了解其分子结构来预测看不见的药物。我们通过整合三个任务中的 8 个数据集,构建了一个包含超过 21,000 种药物的异构药物发现数据集。与在单个任务或单个数据集上训练的方法相比,我们的方法获得了显着的改进。我们进一步揭示了 8 个数据集和 3 个任务之间的可迁移性,为理解药物机制提供了新的见解。关键词:多任务学习、药物靶标预测、药物副作用预测、药物反应预测可用性:https://github.com/jiangdada1221/DrugOrchestra
摘要 — 药物-靶标相互作用 (DTI) 预测在药物发现和化学基因组学研究中非常重要。机器学习,尤其是深度学习,在过去几年中极大地推动了这一领域的发展。然而,学术论文中报告的性能与实际药物发现环境中的性能之间存在显著差距,例如基于随机分割的评估策略在估计现实环境中的预测性能时往往过于乐观。这种性能差距主要是由于实验数据集中隐藏的数据偏差和不适当的数据分割。在本文中,我们构建了一个低偏差 DTI 数据集,并研究了更具挑战性的数据分割策略,以改进现实设置的性能评估。具体而言,我们研究了流行的 DTI 数据集 BindingDB 中的数据偏差,并使用五种不同的数据分割策略重新评估了三种最先进的深度学习模型的预测性能:随机分割、冷药分割、支架分割和两种基于层次聚类的分割。此外,我们全面检查了六个性能指标。我们的实验结果证实了流行的随机分割的过度乐观,并表明基于层次聚类的分割更具挑战性,并且可以在现实世界的 DTI 预测设置中提供对模型通用性的更有用的评估。索引术语——药物-靶标相互作用、数据偏差、数据分割策略、性能评估
确定化学物质与毒性靶标相互作用的能力,例如不良结局途径中的蛋白质,是药物发现和风险评估的重要步骤。筛选化学毒性目标相互作用的计算方法可以作为传统体外 /体内方法的快速替代方法。在这项工作中,我们开发了一种基于化学相似的方案,该方案可以预测化学物质与64个已建立的毒性靶标相互作用的潜力。特别是,我们从公共数据源创建了一个化学基因组学数据库,以识别目标代表,即已知与所选靶标相互作用的化学物质。我们使用Chembl数据库的外部评估集在正确排名的已知相互作用化合物中评估了2D和3D相似性方法的性能。我们发现2D方法在目标预测中的表现优于3D方法。在这里,我们使用基于2D相似性的筛选方法开发了一种公开可用的毒性profiler网站(https://toxpro.bhsai.org/),该方法允许用户为一组查询化合物获得毒性目标配置文件。我们将探测器用于屏幕649已知的急性和剧毒化学物质,全球统一系统(GHS)得分小于2。在此组中,乙酰胆碱酯酶是毒性的最常见目标。开发的毒性特性工具提供了一种快速筛选化学毒性的机制的方法。