摘要:传统的高通量筛选 (HTS) 药物发现效率低下。具有临床治疗潜力的化合物的命中率通常为 0.5%,最多只有 2%。深度学习模型将筛选率提高到 28%;然而,这些结果包括与治疗无关浓度的命中、训练集的新颖性不足以及遍历有限的化学空间。这项研究介绍了一种新型人工智能 (AI) 驱动平台 GALILEO 和分子几何深度学习 (Mol-GDL) 模型 ChemPrint。该模型部署了 t 分布随机邻域嵌入 (t-SNE) 数据分割,以在训练期间最大化化学差异,并部署了自适应分子嵌入,以增强预测能力并探索未知的分子领域。回顾性测试时,ChemPrint 的表现优于一组五个模型难以用药的肿瘤靶点 AXL 和 BRD4,使用 t-SNEsplit 实现平均 AUROC 得分 AXL 为 0.897,BRD4 为 0.876,相比之下,基准模型得分范围为 AXL 为 0.826 至 0.885,BRD4 为 0.801 至 0.852。在一项零样本前瞻性研究中,体外测试表明,ChemPrint 提名的 41 种化合物中有 19 种在浓度≤20µM 时表现出抑制活性,命中率为 46%。这 19 个命中报告的平均-最大 Tanimoto 相似度得分相对于其训练集为 0.36,得分为 0.13 (AXL)和 0.10(BRD4)相对于这些目标的临床阶段化合物。我们的研究结果表明,通过在具有最大差异性的数据集上训练和测试 ChemPrint 来增加测试集难度可以增强模型的预测能力。这导致发现具有低治疗浓度和高化学新颖性的高命中率的化合物库。综上所述,所提出的平台设定了新的性能标准。
●针对MTA合并性PRMT5抑制剂(在第1/2阶段试验中)的基因表达,蛋白质组学,shRNA敲低和广泛的重新利用数据集相关性,据报道优先针对MTAP-MTAP-浸没细胞活性。●分别具有PRMT5和MTAP的化合物靶标和预期的生物标志物是最强的命中率之一,与Prism中的复合响应相关
总之,本研究评估了不同 AI 技术用于专利现有技术检索的可行性,包括监督和无监督机器学习,并发现明确的证据表明,没有任何可用的 AI 算法可以单独支持现有技术检索过程的每个方面。作为本研究的一部分开发的概念验证使用不同的最新 AI 算法来处理专利现有技术检索过程的不同部分。实验结果给出的“命中率”高于专利审查员使用其当前搜索工具所获得的命中率,这表明 AI 工具有可能在未来作为现有技术检索过程的一部分协助专利审查员。本研究确定了将 AI 与 NLP 和计算语义相结合的新方法的潜力,并强调了以人为本的决策和绩效支持工具的重要性。然而,还需要进一步开展更大规模、更严格的测试,收集更多的专利,在更广泛的不同技术领域招募更多的专利审查员,以及开展更多前沿研究,研究支持灵活搜索策略和动态迭代搜索过程的新算法。
摘要:传统的高通量筛查(HTS)药物发现效率低下。具有临床治疗潜力的化合物的命中率通常为0.5%,最大最高为2%。深度学习模型使筛查率丰富至28%;但是,这些结果包括具有非治疗性相关浓度的命中,其训练集的新颖性不足以及化学空间有限。这项研究介绍了一种新颖的人工智能(AI)驱动的平台,伽利略和分子几何深度学习(Mol-GDL)模型,Chemprint。该模型部署了两个T分配的随机邻居嵌入(T-SNE)数据分裂,以在训练和适应性分子嵌入过程中最大化化学差异,以增强预测能力并导航未知的分子领土。进行回顾性测试时,Chemprint的表现优于五个模型的小组,用于难以放药肿瘤学目标,AXL和BRD4,AXL的AUROC平均得分为0.897,BRD4的AUROC得分为0.876,使用T-SNE分配的BRD4为0.826至0.826至0.885的基准分型,而T-SNE分开的平均得分为0.885。在一项零照片的前瞻性研究中,体外测试表明,通过针对AXL和BRD4提名的41种化合物中有19种在浓度≤20µm时表现出抑制活性,命中率为46%。19次命中报告的平均最高tanimoto相似性得分为0.36,相对于其训练组,得分为0.13(AXL)和0.10(BRD4),相对于这些目标的临床阶段化合物。这会导致以低治疗浓度和高化学新颖性的高命中率发现化合物文库。我们的发现表明,通过训练和测试具有最大差异性的训练和测试化学印记增加了测试的难度增强了模型的预测能力。综上所述,提议的平台设定了新的性能标准。
知识图谱问答 (KGQA) 的流行模型,包括语义解析和端到端 (E2E) 模型,解码后会变成一个受限的 KG 关系空间。尽管 E2E 模型在测试时可以容纳新实体,但这种约束意味着它们无法访问新关系,每当向 KG 添加新关系时,都需要进行昂贵且耗时的重新训练。我们提出了 KG-Flex,一种用于 E2E KGQA 的新架构,它将解码为一个连续的关系嵌入空间,从而允许在测试时使用新关系。KG-Flex 是第一个支持使用全新三元组进行 KG 更新的架构,无需重新训练,同时仍支持通过简单、弱监督 (Q, A) 对进行端到端训练。我们的架构节省了重新训练的时间、精力和数据资源,同时仍保持了标准基准上的性能。我们进一步展示了新关系的零样本使用,在三个 QA 数据集上实现了高达 82% 的基线命中率@1。KG-Flex 还可以进行微调,所需时间明显短于完全重新训练;对目标数据进行 10% 完全训练的微调可将命中率@1 提高到基线的 89-100%。
在预订期间,使用快速DNA技术收集 /分析了被捕者的DNA样品。立即在Codis中搜索被捕者的DNA轮廓,以针对光盘中的法医概况进行搜索。任何快速命中率都会生成未经请求的DNA通知(UDN)。UDN将通过国家执法电信系统(NLETS)将UDN路由到执法机构的ORI。一旦可行,NYSP FIC将与执法机构联系以确认收到UDN。
在预订期间,使用快速DNA技术收集 /分析了被捕者的DNA样品。立即在Codis中搜索被捕者的DNA轮廓,以针对光盘中的法医概况进行搜索。任何快速命中率都会生成未经请求的DNA通知(UDN)。UDN将通过国家执法电信系统(NLETS)将UDN路由到执法机构的ORI。一旦可行,NYSP FIC将与执法机构联系以确认收到UDN。
设计酶以在新型化学环境中起作用是合成生物学具有广泛应用的核心目标。使用机器学习(ML)引导蛋白质设计有可能通过精确导航坚固的健身景观来加速发现高性能酶。在这项工作中,我们描述了ML引导的运动,以设计Nuclease NucB,该核定是一种酶,该酶在治疗慢性伤口的酶降解生物膜,以治疗慢性伤口。在多发酶演化活动中,我们将超高通量功能筛选与ML相结合,并将其与平行的电脑内定向进化(DE)和硅内命中重组(HR)策略进行了比较。ML引导的运动发现了数百种高度活跃的变体,最多有19倍的核酸酶活性改善,而DE的最佳变体提高了12倍。此外,ML设计的命中率距离NUCB WildType高达15个突变,在命中率和多样性方面远远超过了HR方法。我们还表明,仅在进化数据上训练的模型而无需访问任何实验数据,就可以比传统的初始图书馆生成方法以明显高的速率设计功能变体。为了推动ML引导设计的未来进展,我们策划了一个55K多种变体的数据集,这是迄今为止最广泛的基因型 - 表型酶活性景观之一。数据和代码可在以下网址提供:https://github.com/google-deepmind/nuclease_design。
无人机和巡飞弹(又称“自杀无人机”)对武装部队构成了重大挑战,最近的冲突就是明证。其中一个例子就是 HESA Shahed 136,这是一种低成本、高耐久性的巡飞弹,具有大载荷能力和精确打击能力。当前针对中短程空中威胁的系统大多依赖于传统的防空系统设计。这些系统是为了摧毁战斗机或直升机而开发的。因此,它们对付作战无人机的性能非常差,而且成本过高。另一方面,提供成本效益高的效应器的枪基系统射程有限,命中率低。最糟糕的情况是一群低成本无人机发动饱和攻击。