人工智能 (AI) 已经改变了医疗保健,从诊断和治疗到医疗服务管理,当然还有制药制造。人工智能在生物制药行业的应用已经在 2020 年产生了近 7 亿美元的全球市场价值,预计到 2025 年将大幅增长至近 30 亿美元,到不远的 2030 年将达到 90 亿美元 [1]。但是,这个被大肆宣传的人工智能概念是什么,以及它如何应用于药物开发领域,需要讨论。虽然没有明确的定义,但从广义上讲,人工智能渴望使机器获得类似人类的能力,例如通过示例学习、适应环境和决策 [2]。它主要涉及“摄取”任何类型的输入数据的算法(生物信号、医学图像和基因序列都在发挥作用),学习识别其中的常见模式,最后主要利用这些知识根据它们的相似性对它们进行聚类(这一领域称为“无监督学习”)或接受识别其类别的训练(所谓的“标签”或“类别”),以便能够对新的数据样本进行分类(这一领域称为“监督学习”)。深入研究人工智能的“内部工作原理”,存在多种方法可以执行这些任务,从更传统的机器学习(ML)到更先进和新颖的深度学习(DL)子领域,包括复杂且计算量大的算法,通常应用于大量数据,以便得出结论并以极高的准确性做出决策。AI 模型从数据中“自行”学习的基本特性,加上其针对特定任务的架构适应性,赋予了它们复杂的功能(推理、知识提取、最优解搜索),使其适用于药物制造的各种程序,从药物发现和开发到临床测试、扩大生产和质量控制 [3]。高效、安全的化合物输送一直是传统药物制造的“致命弱点” [4]。开发新药物的经济和时间成本,其中大多数在测试期间被认定为不合格,给行业带来了严重的“痛苦”,而 AI 可以缓解这种痛苦。然而,药物发现和设计并不是 AI 升级的唯一领域。一种新药的测试从开始到获批可能要花 10 多年的时间 [9],因此人工智能在加速此类程序方面的关键作用显而易见。通过利用与病理生理机制目标和候选化合物特性相关的大量数字化数据(“组学”和来自相关数据库的数据),以及来自类似化合物临床试验的效率和安全性信息,AI可以巧妙地“混合”这些“大数据”来预测手头药物的特性和相互作用,这一过程通常称为计算机实验[5]。这种先进的计算技术可以升级药物发现和新颖设计的许多关键过程,包括预测3D蛋白质结构,以谷歌的“AlphaFold” [6]为突出例子,识别针对疾病特异性靶标的生物活性配体[7],以及寻找新物质的有效合成途径[8]。临床试验如此耗时并损害该领域的投资有两个基本原因:患者纳入不理想以及对预期和不良反应的监测不完整。人们已经努力解决这两个问题。IBM 开发了一个系统,该系统利用大量患者的过往病历和临床数据,为详细的患者匹配提出最佳策略,从而避免招募失败、退出风险和设计动力不足 [10]。还有其他方法可以在早期测试阶段准确预测不良反应,从而最大限度地降低进行可能失败的试验的风险 [11]。此外,先进的人工智能计算机视觉在质量控制中发挥着重要作用,为此类技术的应用增加了价值。通过提供大量相关的视觉示例来训练人工智能模型检测有缺陷的产品或批次,人工智能可以在生产线进入市场之前有效地发现生产线中存在的故障 [12]。最后,药品制造的“物流”也是一个可以提高生产效率和可扩展性的领域。人工智能可用于分析生产流程的步骤(材料的生产、储存和运输,以及相关的成本和时间要求),将这些信息与市场需求数据相结合,并为生产计划提出最佳解决方案 [13]。所有这些子域集成都揭示了人工智能在生物制药行业当前的适用性和未来潜力。然而,这并不意味着这些方法可以摆脱与大规模人工智能解决方案相关的典型瓶颈:数据稀疏、硬件不足和缺乏专业知识。除了数据需求之外,先进的技术基础设施也是实现大型企业产生了大量无价的数据,这些数据可能会推动“数据饥渴型”人工智能方法的发展,但它们在很大程度上保持着专有性,并拒绝共享。尽管有鼓励数据开放的积极举措,但相关社区的心态在这方面还远未成熟 [14]。
主要关键词