脑部疾病通常通过磁共振成像(MRI)来诊断,以识别解剖偏差,在某些情况下,通过磁共振波谱(MRS)来评估代谢异常[1,2]。磁共振波谱成像(MRSI)以覆盖大脑的二维或三维网格中体素的光谱形式提供代谢信息。MRS 可帮助确定脑部疾病的类型和严重程度,在局部或异质性病变的情况下,可将体素分为健康、非健康或疾病严重程度,例如脑肿瘤[3-12]。在通过 MRI 诊断脑部疾病时,正确的图像分割对于可视化解剖结构和识别病理区域非常重要。相反,在通过 MRSI 进行诊断时,重点更多地放在特征选择算法上,以识别代谢异常[13,14]。在大多数 MRSI 研究中,MRI 用于解剖指导,但事实已证明,将其与 MRI 信息相结合可提高诊断水平[4、10、13、15–18]。卷积神经网络(CNN)[19] 在医学图像分割方面取得了成功[20–23]。CNN 是一种人工神经网络[24],是目前图像分类的最新技术[25–27]。它们通过卷积充当特征提取器。输入与一个或多个核进行卷积,并使用新的表示来预测输入属于哪个类。因此,经过训练后,核会生成原始输入的表示,该表示更适合区分分配给不同类别的样本。最近,CNN 已应用于 MRS(I) 数据,以估算代谢物的组织浓度 [ 28 – 30 ]、提高 MRSI 的空间分辨率 [ 31 ] 以及评估 MRSI 光谱质量和过滤伪影 [ 32 , 33 ],但它们尚未用于通过 MRSI 对疾病进行分类。使用 MRSI 数据开发分类模型的一个挑战是可用的案例数量有限。MRSI 数据通常很稀缺,阻碍了使用具有许多参数需要学习的深度神经网络架构。因此,在本文中,我们研究了使用只有一个隐藏层的浅层 CNN 对 MRSI 疾病进行分类。尽管光谱和图像是不同的数据类型,但它们都以特征局部性为特征:图像在空间上是局部性,而光谱在光谱上是局部性 [ 34 ]。特征局部性意味着相邻特征的值高度相关。这些相邻特征是光谱的相邻频率和图像的附近像素。在本文中,我们基于 [ 35 ] 提出了一种 CNN 方法,利用这种特征局部性对脑体素进行分类。为了实现这一点,我们设计了一种类型融合方法,其中光谱和图像数据被联合用于训练具有单个隐藏卷积层的 CNN,该层考虑了光谱的光谱局部性和图像的空间局部性。此外,我们在损失函数中添加了一个正则化项,以惩罚权重值的较大变化,从而避免过度拟合。具体来说,我们考虑了一个具有两个输入分支的 CNN,每个分支都有一个隐藏的卷积层,以便同时处理脑体素的光谱和图像特征。每个分支都由一个隐藏的卷积层组成。这两个分支的输出是
人工智能 (AI) 已经改变了医疗保健,从诊断和治疗到医疗服务管理,当然还有制药制造。人工智能在生物制药行业的应用已经在 2020 年产生了近 7 亿美元的全球市场价值,预计到 2025 年将大幅增长至近 30 亿美元,到不远的 2030 年将达到 90 亿美元 [1]。但是,这个被大肆宣传的人工智能概念是什么,以及它如何应用于药物开发领域,需要讨论。虽然没有明确的定义,但从广义上讲,人工智能渴望使机器获得类似人类的能力,例如通过示例学习、适应环境和决策 [2]。它主要涉及“摄取”任何类型的输入数据的算法(生物信号、医学图像和基因序列都在发挥作用),学习识别其中的常见模式,最后主要利用这些知识根据它们的相似性对它们进行聚类(这一领域称为“无监督学习”)或接受识别其类别的训练(所谓的“标签”或“类别”),以便能够对新的数据样本进行分类(这一领域称为“监督学习”)。深入研究人工智能的“内部工作原理”,存在多种方法可以执行这些任务,从更传统的机器学习(ML)到更先进和新颖的深度学习(DL)子领域,包括复杂且计算量大的算法,通常应用于大量数据,以便得出结论并以极高的准确性做出决策。AI 模型从数据中“自行”学习的基本特性,加上其针对特定任务的架构适应性,赋予了它们复杂的功能(推理、知识提取、最优解搜索),使其适用于药物制造的各种程序,从药物发现和开发到临床测试、扩大生产和质量控制 [3]。高效、安全的化合物输送一直是传统药物制造的“致命弱点” [4]。开发新药物的经济和时间成本,其中大多数在测试期间被认定为不合格,给行业带来了严重的“痛苦”,而 AI 可以缓解这种痛苦。然而,药物发现和设计并不是 AI 升级的唯一领域。一种新药的测试从开始到获批可能要花 10 多年的时间 [9],因此人工智能在加速此类程序方面的关键作用显而易见。通过利用与病理生理机制目标和候选化合物特性相关的大量数字化数据(“组学”和来自相关数据库的数据),以及来自类似化合物临床试验的效率和安全性信息,AI可以巧妙地“混合”这些“大数据”来预测手头药物的特性和相互作用,这一过程通常称为计算机实验[5]。这种先进的计算技术可以升级药物发现和新颖设计的许多关键过程,包括预测3D蛋白质结构,以谷歌的“AlphaFold” [6]为突出例子,识别针对疾病特异性靶标的生物活性配体[7],以及寻找新物质的有效合成途径[8]。临床试验如此耗时并损害该领域的投资有两个基本原因:患者纳入不理想以及对预期和不良反应的监测不完整。人们已经努力解决这两个问题。IBM 开发了一个系统,该系统利用大量患者的过往病历和临床数据,为详细的患者匹配提出最佳策略,从而避免招募失败、退出风险和设计动力不足 [10]。还有其他方法可以在早期测试阶段准确预测不良反应,从而最大限度地降低进行可能失败的试验的风险 [11]。此外,先进的人工智能计算机视觉在质量控制中发挥着重要作用,为此类技术的应用增加了价值。通过提供大量相关的视觉示例来训练人工智能模型检测有缺陷的产品或批次,人工智能可以在生产线进入市场之前有效地发现生产线中存在的故障 [12]。最后,药品制造的“物流”也是一个可以提高生产效率和可扩展性的领域。人工智能可用于分析生产流程的步骤(材料的生产、储存和运输,以及相关的成本和时间要求),将这些信息与市场需求数据相结合,并为生产计划提出最佳解决方案 [13]。所有这些子域集成都揭示了人工智能在生物制药行业当前的适用性和未来潜力。然而,这并不意味着这些方法可以摆脱与大规模人工智能解决方案相关的典型瓶颈:数据稀疏、硬件不足和缺乏专业知识。除了数据需求之外,先进的技术基础设施也是实现大型企业产生了大量无价的数据,这些数据可能会推动“数据饥渴型”人工智能方法的发展,但它们在很大程度上保持着专有性,并拒绝共享。尽管有鼓励数据开放的积极举措,但相关社区的心态在这方面还远未成熟 [14]。
