a 马德拉斯大学,Chepauk,钦奈 600 005,印度 b SRM 大学,泰米尔纳德邦 603203,印度 c 波兰科学院分子和大分子研究中心,波兰 d 麦德林大学,麦德林,哥伦比亚
PubChem 自动数据挖掘程序,用于筛选十亿种化合物,并通过基于机器学习的 AutoQSAR 算法生成抗冠状病毒药物线索(复制酶多聚蛋白 1ab 抑制剂)并对顶级药物线索化合物进行计算机模拟研究
本文提出了一种计算方法,该方法可以根据其对给定案例研究的重要性生成IUPAC宣传的官能团的降序。因此,可以从从中成功启动药物发现的功能组列表。使用针对TDP1抑制剂的Pubchem生物测定法证明了适用于任何具有足够数据的研究案例的方法。Scikit学习了对随机森林分类器(RFC)算法的解释。机器学习(ML)型号RFC获得了70.9%的精度,73.1%的精度,66.1%的召回率,69.4%F1和70.8%的接收器操作特征(ROC)。除了主要研究外,还开发了CID_SID ML模型,该模型仅使用PubChem化合物和物质标识符(CID和SIDS)数据,可以以85.2%的精度预测,94.2%精度为94.2%,75%精度,F1的F1,83.5%F1和85.2%ROC的F1和85.2%ROC是否具有化合物是否具有化合物。
数据库数据集分子构象香料二肽677 33850溶剂化氨基酸26 1300 DES370K 3864 364376 PUBCHEM 14643 731856离子对28 1426 NCIATLA ×10 325 3250 IHB100×10 50 500 REP739×5 504 2520 SH250×10 128 1280总计21477 1145910
GtoPdb 网站分析 5 GtoPdb 网站访问统计 5 下载统计 8 GtoPdb 内容 8 GtoPdb 实体增长 9 GtoPdb 更新 10 靶标 10 配体 13 跟踪 BJP/BJCP 作者对新配体和靶标条目的请求 16 与 SIF 合作的天然产物项目 16 对为精选数据做出贡献的期刊的分析 17 AntibioticDB 和全球抗生素研究与发展伙伴关系 18 GtoPdb Web 应用程序开发 19 Web 应用程序更新 19 天然产物 19 核酸 19 连接 21 链接到其他资源 21 Pubchem 连接 22 GtoPdb 的 PubChem 统计数据 23 NCBI LinkOuts 23 欧洲 PMC 24 文献计量学和学术门户 25 核酸研究数据库问题 25 药理学简明指南 25 文献计量学 25 SARS-CoV-2回顾 26 其他 26 EBI UniProtKB/Swiss-Prot 交叉引用 27 HGNC 28 GPCRdb 28 数据库团队活动概述 29
SARS-CoV-2 3CLpro 蛋白是 COVID-19 的主要治疗靶点之一,因为它在病毒复制中起着关键作用,具有各种高质量的蛋白质晶体结构,并可作为计算筛选具有改进的抑制活性、生物利用度和 ADMETox 特性的化合物的基础。ChEMBL 和 PubChem 数据库包含筛选针对 SARS-CoV-2 3CLpro 的小分子的实验数据,这扩大了学习模式和设计计算模型的机会,该模型可以在体外和体内测试之前预测任何药物化合物对抗冠状病毒的效力。在这项研究中,我们利用几个描述符评估了 27 个机器学习分类器。我们还开发了一个神经网络模型,该模型可以在 CheMBL 数据上以 91% 的准确率正确识别生物活性和非活性化学物质,在 CheMBL 和 Pubchem 的组合数据上以 93% 的准确率正确识别生物活性和非活性化学物质。非活性和活性化合物的 F1 分数分别为 93% 和 94%。在 XGB 分类器上使用 SHAP (SHapley Additive exPlanations) 从 PaDEL 描述符中找出此任务的重要指纹。结果表明,PaDEL 描述符在预测生物活性方面是有效的,所提出的神经网络设计是有效的,并且通过 SHAP 的解释因子正确地识别了重要的指纹。此外,我们使用包含超过 100,000 个分子的大型数据集验证了我们提出的模型的有效性。本研究采用了各种分子描述符来发现最适合此任务的描述符。为了评估这些可能的药物对抗 SARS-CoV-2 的有效性,需要进行更多的体外和体内研究。
医学院,美国马萨诸塞州,美国马萨诸塞州。Abstract word count : 233 Total Word count : 3855 Figures : 3 Tables : 3 Key words : type 2 diabetes, weight loss, anti-diabetic drugs, body composition, diabesity Running title : Anti-diabetic drugs and weight loss in T2D Chemical compounds: Drug PubChem CID Metformin 4091 Acarbose 41774 Dapagliflozin 9887712 Canagliflozin 24812758 Ertugliflozin 44814423 Empagliflozin 11949646 Exenatide 45588096 liraglutide 16134956 Semaglutide Semaglutide 56843331#sepress for nore viorwologiny:Paolo fiornology and botornogoly and boton tworgon,bost ost worge tworgon,bost ynepon tworgon,bost y phd phd phd phd phd, Ave,02115波士顿,MA电子邮件:paolo.fiorina@childrens.harvard.edu orcid ID:Paolo Fiorina 0000-0002-1093-7724
目前,化合物和生物活性数据库(如 ChEMBL 3 和 PubChem 4 合计)中共有超过 9000 万条候选药物化合物记录,而整个“类药物”化学空间的大小估计约为 1060。5 另一方面,根据 DrugBank 的数据,目前的药物数量(FDA 批准或处于实验阶段)约为 10000 种。6 此外,在人类蛋白质组的 20000 种蛋白质中,已知药物的靶标不到 3000 种。7,8 统计数据表明,目前对药物-靶标空间的了解有限,需要新的方法来拓宽我们的知识。有关药物-靶标相互作用 (DTI) 自动预测的信息、基于机器学习 (ML) 的 DTI 预测中的描述符和特征工程,以及基于新型深度学习 (DL) 的
最近由SARS-COV-2引起的大流行是整个世界的主要健康问题。快速传播和这种疾病的死亡率对人类社会构成了严重威胁。通过研究其认真对待这种疾病的药物是当今的最大任务。在本研究中,计算方法用于寻找针对SARS-COV-2感染的有效化合物。1452具有潜在抗病毒活性的化合物从PubChem数据库中选择,以搜索潜在的抑制剂SARS-COV-2的治疗靶标。使用Maestro 12.4(Schrodinger Suite)进行了分子对接和吸收,分布,代谢,消除和毒性(ADMET)性质研究。所有选定的化合物被汇合到六种化合物,这些化合物被发现对SARS-COV-2的所有五个靶标有效。Among six compounds, compound C6 is exhibited excellent docking score -8.93, -8.21, -7.93, -6.73 kcal/mol with main protease (Mpro), angiotensin-converting enzyme-2 (ACE2), RNA dependent RNA polymerase (RdRp), and endoribonuclease (NSP15) target proteins respectively.