亲爱的编辑: 在中药现代化中,确定草药中的有效成分和阐明有效成分与靶标之间的作用机制是两个关键方面。建立一个全面且高可靠性的中药数据库是非常可取的。我们的 TCM Database@Taiwan1 自 2011 年成立以来,已被广泛使用和大量引用,并且还被收录到 ZINC 数据库 2 中。我们使用自然语言处理,建立了知识图谱和分子信号传导通路来建立中药数据库 TCMBank ( https://TCMBank.cn/ ),它从 TCM Database@Taiwan 扩展而来,包括 9192 种草药、61,966 种成分、15,179 个靶标和 32,529 种疾病。更新后的中药库将中药成分数量由32,364种扩充至61,966种(非重复),并增加了靶点和疾病两个新数据字段。具有连接信息的中药数量为9010种,中药平均连接边数为16.05。具有连接信息的成分数量为54,676种,中药平均连接边数为5.26。TCMBank以mol2格式提供中药成分的三维结构,并提供与外部公共数据库的交叉引用链接,如CAS、DrugBank、PubChem、MeSH、OMIM、DO、ETCM、3 HERB、4等。目前,TCMBank是最全面、可下载、最大的非商业中药数据库,TCMBank与其他中药相关数据库的数据规模比较见图1 a。中西药库提供了一个方便的用户自由探索草药、成分、基因靶点与相关途径或疾病之间的关系的网站(图1b)。图1c展示了中西药库的建立流程,包括文本挖掘策略、智能文档识别模块等。所有与中药相关的信息必须经过志愿者至少两次的人工验证,以确保中西药库数据的可靠性。中西药之间的不良反应会导致医疗费用增加,甚至死亡。据估计,超过10%的患者需要同时服用五种药物,20%的老年患者需要同时服用至少十种药物,这大大增加了中西药互斥带来的医疗风险。中西药互斥反应的鉴别在临床上主要依靠生化分析。然而,这个过程非常耗费人力和物力。基于人工智能的中西药互斥预测需要大量带有不良反应标签的中西药配对。目前中西药互斥数据集尚不完善,而目前有两个现实世界的公共药物相互作用(DDI)数据集:DrugBank 和 TWOSIDES。在前期工作中,我们首先提出了两个模型,3DGT-DDI 5 和 SA-DDI, 6 在 DDI 数据集上预测两种化合物之间的相互作用。
阿尔茨海默氏病(AD)是老年人中常见的神经退行性痴呆。尽管没有有效治疗AD的有效药物,但在相关研究中已经发现了与AD相关的蛋白质。蛋白质之一是线粒体融合蛋白2(MFN2),其调节大概与AD有关。但是,没有针对MFN2调节的特定药物。在这项研究中,在扩展的戴维斯数据集中构建和训练了三个隧道深神经网络(3个隧道DNN)模型。在预测药物靶向结合属性值时,模型的准确性高达88.82%,损耗值为0.172。通过对药库数据库中1,063种批准的药物和小分子化合物的结合afinity值进行排名,由3个隧道DNN模型推荐了前15个药物分子。去除分子量<200和局部药物后,总共选择了11个药物分子进行文献挖掘。结果表明,六种药物对AD有效,这些药物在参考文献中报告。同时,在11种药物上实施了分子对接实验。结果表明,所有11个药物分子都可以成功与MFN2停靠,其中5个具有很大的结合作用。
精准医疗结合了分子生物学、化学、材料科学和其他领域的多个跨学科领域,以产生更准确的疾病治疗方法。测序、细胞区室和治疗靶点表征方面的进展,以及制药行业的进步,导致了高级研究和临床试验数量的增加。许多临床试验都涉及用于治疗各种疾病(如代谢、免疫和激素紊乱以及癌症)的蛋白质和肽类药物。[1] 制药市场上大约 10% 的药物是肽类或蛋白质药物,包括 DrugBank 中的 485 条肽类药物 [2] 和 THPdb 中 239 条 FDA 批准的肽类药物。[1] 肽类和蛋白质药物因其生物相容性、通过氨基酸序列变化设计的灵活性以及独特的分子拓扑结构,在从传感和催化到治疗等各种应用中具有巨大潜力。 [3] 更具体地说,它们表现出独特的属性,例如氢键潜力、氨基酸固有的手性、多态性 [4] 和源自肽键的构象刚性。[3] 此外,肽可以是天然的也可以是合成的,例子包括重组激素、抗菌肽、抗体和重组酶,[5] 此外,还可以加入非天然氨基酸来进一步实现化学多样化。[6]
摘要:RAS–RAF–MEK–ERK 通路在许多肿瘤的恶性细胞进展中起着关键作用。上游激酶的高度结构复杂性限制了治疗进展。因此,MEK 抑制是一种有前途的策略,因为它易于抑制,并且是其下游效应物许多恶性作用的守门人。尽管 MEK 抑制剂在许多癌症中正在接受研究,但耐药性仍然是实现癌症患者治愈的主要限制因素。因此,我们通过发现癌症治疗中的双靶向疗法完成了高通量虚拟筛选,以克服这一瓶颈。在这里,通过高通量虚拟筛选评估了总共 11,808 个 DrugBank 分子对 MEK 的活性。此外,实施了 Glide 对接、MLSF 和 prime-MM/GBSA 方法,从数据库中提取潜在的先导化合物。两种化合物 DB012661 和 DB07642 在所有筛选分析中均表现出色。此外,研究结果还表明,先导化合物还具有与共同靶标 PIM1 的显著结合能力。最后,基于 SIE 的自由能计算表明,化合物的结合主要受范德华力与 MEK 受体相互作用的影响。总体而言,这些先导化合物对 MEK 和 PIM1 的计算机结合效力可能在不久的将来对克服耐药性具有重要的治疗意义。
摘要 背景 检查点靶点在肿瘤介导的免疫逃逸中起着关键作用,因此对癌症免疫治疗至关重要。不幸的是,缺乏汇编所有检查点靶点以用于免疫肿瘤学中的转化研究和药物发现的生物信息学资源。 方法为此,我们开发了检查点治疗靶点数据库 (CKTTD),这是第一个针对免疫检查点靶点(蛋白质、miRNA 和 LncRNA)及其调节剂的综合数据库。采用评分系统以高置信度筛选更多相关靶点。此外,Oncomine、Drugbank、miRBase 和 Lnc2Cancer 数据库等一些生物数据库被集成到 CKTTD 中,以提供深入的信息。此外,我们计算并提供了所有靶点的配体结合位点信息,这可能为基础科学家进行药物发现工作提供支持。结果 CKTTD 总共汇编了 105 个检查点蛋白靶点、53 个调节剂(小分子和抗体)、30 个 miRNA 和 18 个 LncRNA,这些实验证据均通过增强型文本挖掘系统从 10 649 篇文献中整理出来,这些证据均经过验证。 结论 总之,CKTTD 可以作为癌症免疫治疗和药物发现研究的有用平台。CKTTD 数据库可在 http://www.ckttdb.org/ 上免费向公众开放。
通过识别对 SARS-CoV-2 有效的已知药物,药物再利用可以加快药物开发过程。SARS-CoV-2 刺突蛋白的 RBD 结构域是一个有前途的药物靶点,因为它在病毒-宿主附着中起着关键作用。这些特定的结构域可以用小分子或药物靶向,以破坏病毒与宿主蛋白的附着。在这项研究中,使用虚拟筛选方法和计算化学方法筛选了 FDA 批准的药物库数据库。根据对接分数和结合能,五种药物被列入进一步分析的候选名单。进一步测试了这些选定药物的体外生物活性。计算研究的预测与药物对 RBD-ACE2 结合的实际抑制之间存在显着相关性。然后,我们进行了一系列研究,模拟 COVID-19 患者中看到的一些生物事件,例如 IL1β 的分泌、通过产生血栓调节蛋白呈现更具血栓性的内皮细胞以及肺部单核细胞等炎症细胞的积聚。在所有药物中,最有希望的药物是用于治疗 2 型糖尿病的 Ertugliflozin。该药物具有多种理想的特性,可能是立即用于治疗 COVID-19 的良好候选药物。
化学库对于促进药物发现过程至关重要。人们普遍认为,化学库的质量取决于其可用性和化学多样性等因素,这有助于提高找到良好匹配项的机会。在这方面,我们的小组开发了一种有用的化学品来源,称为药物和生物化学 (MBC) 库。它源于我们研究小组 30 多年的药物设计和发现经验,并成功地为神经系统、神经退行性疾病和传染病提供了有效的匹配项。此外,在过去几年中,欧洲化学生物学研究基础设施 EU-OPENSCREEN 生成了欧洲化学生物学库 (ECBL),用作药物发现的匹配项来源。在这里,我们介绍并讨论了 MBC 库的更新版本 (MBC v.2022),它富含新的支架,包含 2,500 多种化合物以及收集约 100,000 个小分子的 ECBL。为了正确处理新版 MBC 库在药物发现方面的改进潜力,我们计算了多达 44 种物理化学和药物特性,并将其与其他知名的公开库进行了比较。为了进行比较,我们使用了 ZINC20、DrugBank、ChEMBL 库、ECBL 和 NuBBE 以及已批准的药物库。最终结果证实了 MBC v.2022 和 ECBL 所涵盖的竞争性化学空间以及合适的类药物特性。总之,我们可以肯定这两个库代表了药物发现新发现的有趣来源。
上皮性卵巢癌进展过程中的球体形成与腹膜器官定植、疾病复发和不良预后相关。尽管已证明癌症进展与转化细胞内的代谢变化有关并受其驱动,但代谢动力学与转移性形态转变之间的可能关联仍未被探索。为了解决这个问题,我们进行了定量蛋白质组学研究,以确定与高级别浆液性卵巢癌系 OVCAR-3 的三种不同形态(2D 单层和两种几何上独立的三维球体状态)相关的蛋白质特征。将蛋白质状态整合到基因组规模的代谢模型中,使我们能够为 OVCAR-3 细胞系的每个形态阶段构建特定于上下文的代谢模型,并系统地评估它们的代谢功能。我们利用这些模型获得了驱动疾病的代谢反应模块,并阐明了基因敲除策略以减少与疾病进展相关的代谢改变。我们探索了 DrugBank 数据库以挖掘药剂,并评估了药物在抑制癌症进展方面的作用。最后,我们通过实验验证了我们的预测,证实了我们预测的药物之一:神经氨酸酶抑制剂奥司他韦能够破坏转移性球状形态,而不会对未转化的基质间皮单层细胞产生任何细胞毒性作用。
靶向药物的开发使得癌症治疗可以实现精准医疗,并实现最佳的靶向治疗。准确识别癌症药物基因有助于加强对癌症靶向治疗的认识,促进癌症的精准治疗。然而,由于多组学数据的多样性和复杂性,发现的癌症药物基因非常少见。本研究提出了一种基于机器学习的癌症药物基因发现新方法DF-CAGE。DF-CAGE整合了~10000个TCGA谱中的体细胞突变、拷贝数变异、DNA甲基化和RNA-Seq数据,以识别癌症药物基因的概况。我们发现DF-CAGE从多组学数据的角度发现了目前已知的癌症药物基因的共性,并在OncoKB、Target和Drugbank数据集上取得了优异的表现。在~20,000个蛋白质编码基因中,DF-CAGE精确定位了465个潜在的癌症药物基因。我们发现候选癌症药物基因(CDG-基因)具有临床意义,可分为高可信、可靠和潜在基因集。最后,我们分析了组学数据对药物基因识别的贡献。我们发现DF-CAGE主要根据CNA数据、基因重排和人群中的突变率来报告药物基因。这些发现可能对未来新药的研究和开发有所启发。
在我们的论文 [ 1 ] 中,我们建议挖掘生物医学知识图谱,以识别生物分子特征,这些特征能够自动重现此类专家分类,区分是否导致特定类型 ADR 的药物。从可解释的 AI 角度来看,我们探索简单的分类技术,例如决策树和分类规则,因为它们提供了人类可读的模型,可以解释分类本身。我们还评估了以下假设:从知识图谱中挖掘出的生物分子特征可能为 ADR 背后的分子机制提供解释元素。我们用两种专家分类测试了我们的方法,这两种分类可识别是否导致肝脏或皮肤毒性的药物(分别称为 DILI 和 SCAR,分别代表药物引起的肝损伤和严重皮肤不良反应)。与这些药物相关的特征是从 PGxLOD [ 2 ] 中挖掘出来的,PGxLOD 是我们之前通过链接公共开放数据(包括 DisGeNET、PharmGKB、DrugBank、CTD)创建的生物医学知识图谱。为此,我们开发了 kgpm 算法 [ 3 ],该算法能够将特征路径的提取扩展到长度为 4 的水平。随后,这些路径被推广为路径模式,以覆盖更大的药物集。我们训练了两个分类器,根据提取的特征区分是否是药物导致了两种考虑的 ADR。我们分离出既能重现专家分类又能被专家解释的特征(例如,基因本体论术语、药物靶标、途径),并请 3 位药理学专家手动评估它们是否可能解释 ADR。