目前,人们正在研究使用脉冲神经网络 (SNN) 来解决现代 AI 在边缘设备中得到更广泛应用的一个主要障碍:由深度学习产生的大型先进人工神经网络 (ANN) 的能耗。这尤其适用于常用于图像分类的卷积神经网络 (CNN),但也适用于其他应用领域。这些 ANN 必须很大才能实现最佳性能,因为它们需要具有足够多的参数才能从它们所训练的庞大数据集(例如 ImageNet2012 数据集的 120 万张图像)中吸收足够的信息。使用这些大型 ANN 的标准硬件实现进行推理本质上非常耗电 1 。脉冲神经元一直是人工智能计算硬件开发的重点,其能量预算大幅降低,部分原因是大脑的巨型 SNN(由大约 1000 亿个神经元组成)仅消耗 20 W(参考文献 2)。脉冲神经元输出一串称为脉冲的典型脉冲。因此,它们的输出与 ANN 神经元输出的连续数非常不同。大多数考虑在神经形态硬件中实现的脉冲神经元模型都受到大脑中脉冲神经元的简单模型的启发。然而,这些简单的神经元模型并没有捕捉到生物神经元通过不同的时间脉冲模式(而不仅仅是通过它们的发放率)编码不同输入的能力(参见图 1 中的示例)。虽然大型 ANN 经过越来越复杂的深度学习算法在巨型数据集上训练,在多个智能类别中接近甚至超过人类的表现,但当前一代基于脉冲的神经形态硬件的性能却落后了。人们希望在循环脉冲神经网络的情况下可以弥补这一差距,因为可以直接训练这些神经网络来实现循环 ANN 的大部分性能 3 。但是,对于前馈网络来说,生成具有与 ANN 类似的性能且脉冲较少的 SNN 的问题仍然存在。实现真正良好图像分类的前馈 CNN
医学图像分析在临床上引起了广泛关注。借助现代算法,计算机辅助诊断可帮助医生处理病理学以及观察者内和观察者之间的巨大差异。深度学习及其高计算能力将人为设计的特征转换为基于学习的特征提取过程。即使没有该领域的先验知识,模型也可以直接从数据中学习有意义的特征 [1]。因此,构建深度学习算法以学习分层特征表示需要大量数据。使用大数据集实现高精度使卷积神经网络 (CNN) 在医学图像分析任务中广受欢迎,例如肝病变分类 [2]、脑部分析 [3] 和视网膜图像分析 [4]。例如,谷歌提出的方法使用 128 万张视网膜图像来训练其系统以诊断糖尿病视网膜病变 [5],而深度 CNN 在皮肤病变分类方面也取得了理想的效果 [6]。不幸的是,在实际的医疗应用中,如此大量的带标签数据并不总是可访问的。有两个原因限制了医学图像领域对带标签数据的访问。首先,这是一项耗时而繁琐的任务,需要经验丰富的专家花费很长时间进行注释。其次,由于疾病并不常见,因此在应用中也很难获得所需数量的疾病图像。根据差异的类型,图像特征可分为两类,即相关特征和非相关特征 [7]。在医学图像中,相关特征包含确定器官或病变的最有用信息,而非相关特征则是图像之间变化的特征,例如强度差异。对于大多数医学图像应用而言,很难建立大型数据集,尤其是由于罕见疾病和患者隐私。训练小型数据集不利于模型捕捉广义的相关特征,并且可能由于过拟合问题导致性能下降。为了避免过拟合问题并提高深度学习算法的性能[8],研究人员尝试利用数据增强技术[9-12]。数据增强是一种通过向模型提供不同来源的数据来消除不相关方差的方法,它已被研究
巴黎,2020 年 9 月 24 日——法国医疗科技公司 GLEAMER 开发了一款人工智能软件平台,帮助放射科医生诊断患者。该公司宣布,已在 A 轮融资中获得 750 万欧元,领投方为 XAnge,新投资者包括 MACSF、Majycc eSanté Invest 和 Crista Galli Ventures,以及之前的投资者 Elaia 和国有基金 Ambition Amorçage Angels (F3A),后者由 Bpifrance 作为其未来投资计划 (PIA) 的一部分进行管理。此外,包括 Nicolas Theumann 教授在内的 37 位放射科医生参加了本轮融资,此举有望推动 BoneView®(该公司软件系列中的第一款人工智能应用程序)在欧洲、中东、亚洲和拉丁美洲的市场推广。筹集的资金还将用于获得美国食品药品监督管理局 (F.D.A.) 的批准以在美国销售 BoneView® 并继续开发 GLEAMER 的人工智能产品线以用于放射学的其他领域。“GLEAMER 体现了我们的投资指导原则:让尽可能多的人能够使用最先进的技术,在这种情况下,就是使用人工智能帮助放射科医生诊断我们所有患者,”XAnge 的执行合伙人 Guillaume Meulle 说道。“我们很高兴与医疗保健专业人士和与我们一样相信人工智能能够帮助放射科医生进行日常诊断的专项基金一起投资 GLEAMER。GLEAMER 的管理团队在法国市场的卫生当局和医疗界建立了良好的声誉,这让我们有信心其软件平台将被广泛和迅速地采用,”MACSF 集团风险投资经理 Stanislas Subra 说道。如今,全球急诊放射学市场价值 120 亿欧元(来源:GLEAMER)。对医学成像的需求大大增加,全球每年为创伤生成超过 4 亿张医学图像。这是急诊室中最常见的医学检查,包括在法国,每年为创伤生成 1100 万张医学图像(估计来自:https://www.ccomptes.fr/fr/publications/limagerie‐medicale )。GLEAMER 通过为放射科医生提供人工智能来为他们提供支持。一款通过医学图像对创伤进行半自动化诊断的软件。“这轮融资将使我们能够继续在全球推出现有软件,并进一步开发我们的产品线。我们的计划是利用我们的人工智能成为放射科医生的首选合作伙伴。软件平台,将涵盖所有标准放射程序。通过为他们提供半自动化、可靠和快速的诊断,我们帮助他们提高护理质量和生产力,”GLEAMER 联合创始人 Christian Allouche 说道。
成像长期以来一直是癌症研究和临床护理的基石,为了解组织形态和空间细胞间动力学提供了依据。近年来的技术进步使显微镜的规模比以往任何时候都更大,导致常用数据集的大小呈指数级增长 - 这一趋势在未来几年可能会继续加速。生物医学成像中的“大数据”可以沿着两个正交轴来概念化:样本大小和数据维数(图 1)。第一个轴(n)可以通过简单地计算数据集中的病例数来测量。这一维度的扩展主要受到高通量成像技术的进步的推动。一个显著的例子是在病理学领域,数字化工作流程的日益普及导致幻灯片扫描被例行纳入病理学家的工作流程,从而创建了大型全幻灯片图像 (WSI) 数据库。早期采用数字化病理学工作流程的人每年扫描超过 100 万张幻灯片 [1] – 比 TCGA 等当前基准数据集大几个数量级,这表明随着工作流程日益数字化,大型学术三级医院可以预期会定期生成大量数据。与此同时,数据在每张图像中捕获的信息量也在增长,我们将其称为数据维数 (d)。这主要是由空间组学(即蛋白质或 RNA 等分子标记的空间量化)和高度多路复用成像(在 [2] 中进行了综述)的新兴技术推动的。与具有三个通道(红色、绿色和蓝色)的明场图像相比,这些高维图像中的每一个可能具有超过 10,000 个通道,每个通道代表一个特定目标。体积成像通过添加深度维度进一步增加了每个样本中的信息内容,从而能够捕获三维组织形态。因此,即使病例数保持不变,数据集大小也会增长。图像数据的快速增长对癌症研究具有重要意义,尤其是与基因组学和结果等伴随元数据结合使用时。大样本量为发现和量化与临床和生物学相关特征相关的组织学模式提供了足够的能力,最近的研究表明这些方法有潜力改善临床和诊断工作流程 [3-5] 并发现基于图像的生物标志物以重现分子特征 [6, 7]。同样,高维成像数据中捕获的丰富背景信息为以前所未有的分辨率探究肿瘤微环境奠定了基础 [8, 9]。明场显微镜的普遍性使其成为基于图像的生物标志物开发的特别有吸引力的候选者,因为数字工作流程越来越多地部署在更广泛的临床环境中。然而,虽然成像数据集的规模不断扩大带来了新的研究机会和途径,但也带来了重大挑战。也就是说,这些进步只有通过利用计算图像分析方法,特别是深度学习才能实现。深度学习模型灵活而强大,在识别方面表现出显著的成功
成像长期以来一直是癌症研究和临床护理的基石,为了解组织形态和空间细胞间动力学提供了依据。近年来的技术进步使显微镜的规模比以往任何时候都更大,导致常用数据集的大小呈指数级增长 - 这一趋势在未来几年可能会继续加速。生物医学成像中的“大数据”可以沿着两个正交轴概念化:样本大小和数据维数(图 1)。第一个轴(n)可以通过简单地计算数据集中的病例数来测量。这一维度的扩展主要受到高通量成像技术的进步的推动。一个显著的例子可以在病理学领域看到,该领域越来越多地采用数字化工作流程,导致幻灯片扫描被例行纳入病理学家的工作流程,从而创建大型全幻灯片图像 (WSI) 数据库。早期采用数字化病理学工作流程的人每年扫描超过 100 万张幻灯片 [1] - 比 TCGA 等当前基准数据集大几个数量级,并且表明随着工作流程日益数字化,大型学术三级医院可以预期定期生成的潜在数据量。与此同时,数据在每张图像中捕获的信息量也在增长,我们将其称为数据维数 (d)。这主要是由空间组学(即蛋白质或 RNA 等分子标记的空间量化)和高度多路复用成像(在 [2] 中进行了评论)的新兴技术推动的。与具有三个通道(红色、绿色和蓝色)的明场图像相比,这些高维图像中的每一个可能具有多达 10,000 个通道,每个通道代表一个特定目标。体积成像通过添加深度维度进一步增加了每个样本的信息内容,从而能够捕获三维组织形态。因此,即使病例数保持不变,数据集大小也会增长。图像数据的快速增长对癌症研究具有重要意义,尤其是与基因组学和结果等伴随元数据结合使用时。大样本量为发现和量化与临床和生物学相关特征相关的组织学模式提供了足够的能力,最近的研究表明这些方法有潜力改善临床和诊断工作流程 [3-5] 并发现基于图像的生物标志物以重现分子特征 [6, 7]。同样,高维成像数据中捕获的丰富背景信息为以前所未有的分辨率探究肿瘤微环境奠定了基础 [8, 9]。随着数字工作流程越来越多地部署在各种临床环境中,明场显微镜的普遍性使其成为基于图像的生物标志物开发的特别有吸引力的候选者。然而,虽然成像数据集规模的增加带来了新的研究机会和途径,但也带来了重大挑战。也就是说,这些进步只有通过利用计算图像分析方法,特别是深度学习才有可能实现。深度学习模型灵活而强大,在识别方面已显示出显著的成功
细菌、真菌、病毒、酵母和原生动物等微生物污染物引起了食品制造商的极大兴趣和担忧,因为它们可能存在食物中毒或食物腐败的风险(Maruthamuthu 等人,2020 年)(Talo,2019 年)。对数字微生物数据的需求不断增长,为微生物学家和实验室专业人员提供了轻松检测微生物的机会(Egli 等人,2020 年)。这种变化可以个性化诊断和治疗,提高数字数据质量,并降低医疗成本。传统的基于培养的微生物检测方法非常耗时,而数字成像因其快速的方法而备受关注。数字微生物学还有可能对公共卫生和病原体监测产生重大影响。为了实现数字化,微生物实验室必须发展数字医学和食品分析方面的专业知识,包括数据处理、感知和基础设施(Soni 等人,2022 年)。近年来,计算机视觉、人工智能 (AI) 和机器学习 (ML) 等在大量标记数据上进行训练的方法越来越多地用于自动分析医学图像和微生物样本 (Goodswen et al., 2021)。这些方法可用于识别四种不同类型的微生物:细菌、藻类、原生动物和真菌 (Rani et al., 2022)。卷积神经网络和 ResNet-50 等模型可用于确定微生物样本的类别 (Majchrowska et al., 2021) (Rani et al., 2022) (Talo, 2019)。语义分割是一种计算机视觉方法,用于分析微生物样本的图像,当需要根据语义含义精确确定图像的不同区域时,为图像中的每个像素分配一个类标签 (Zawadzki et al., 2021)。 Faster R-CNN 和 Cascade R-CNN 等模型可用于计数微生物样本图像中的细菌菌落,这些模型可以检测单个物体并确定其类别。实例分割方法旨在通过区分图像中单个细菌菌落的不同实例并将每个像素分配给唯一的菌落来提供对图像的详细理解(Zawadzki 等人,2021 年)。Meta 公司开发和训练的 Segment Anything Model (SAM) 用于图像分割(实例分割)(Kirillov 等人,2023 年)。该模型使用超过 10 亿个掩模对 1100 万张图像进行了训练。SAM 模型具有零样本泛化的可能性,因此无需额外训练即可用于图像中对象的分割。SAM 模型可以分析来自广泛领域的图像,包括生物医学、农业、自动驾驶等。2. 方法