神经网络使最先进的方法能够在目标检测等计算机视觉任务上取得令人难以置信的效果。然而,这种成功很大程度上依赖于昂贵的计算资源,这阻碍了拥有廉价设备的人们欣赏先进的技术。在本文中,我们提出了跨阶段部分网络(CSPNet)来从网络架构的角度缓解以前的工作需要大量推理计算的问题。我们将问题归因于网络优化中的重复梯度信息。所提出的网络通过整合网络阶段开始和结束的特征图来尊重梯度的变化,在我们的实验中,在 ImageNet 数据集上以相同甚至更高的精度将计算量减少了 20%,并且在 MS COCO 目标检测数据集上的 AP 50 方面明显优于最先进的方法。 CSP-Net 易于实现且足够通用,可以应对基于 ResNet、ResNeXt 和 DenseNet 的架构。
深度学习是一种更广泛的机器学习方法,它将为机器带来洞察力。如今,深度学习被广泛应用于对象识别、模式识别、自然语言处理和其他图像处理任务。但它主要用在对象识别任务中,如驾驶员辅助系统、自动驾驶系统、目标检测[1]等。在现实生活中。但它也有几个不同的有趣的应用,如黑白图像的着色、为安静的电影添加声音、自动机器翻译、照片中的对象分组、自动手写生成、字符文本生成、图像标题生成和自动游戏。在大多数情况下,深度学习可以借助不同的神经网络架构[2]进行。这些系统主要用于图像提取和训练。深度学习中使用了四种主要的神经网络。
梅赛德斯 - 奔驰和德省大学慕尼黑大学的尤里卡·普罗米修斯(Eureka Prometheus Prometheus Prometheus Promist),以及1984年卡内基·梅隆大学的Navlab和ALV项目,为引入了1980年代的首款自给自足,真正的自动驾驶汽车,并在1984年引入了第一辆自给自足和真正的自动驾驶汽车。在早期阶段,自动驾驶汽车在神经网络(ALVINN)中使用自动陆上车使用神经网络来检测线路并导航。这些车辆受到处理缓慢的处理器和数据不足的限制。自动驾驶汽车必须做出更快的决定,并观察车辆存在的环境。在人工智能增长后,这些车辆配备了AI。AI连接到车辆中存在的每个传感器,并处理从传感器收集的数据。使用这些收集的数据是使用复杂算法的,AI实时做出决策。
卷积神经网络(CNN)被广泛用于解决各种问题,例如图像分类。由于其计算和数据密集型性质,CNN加速器已被开发为ASIC或FPGA。应用程序的复杂性增加导致这些加速器的资源成本和能源需求增长。尖峰神经网络(SNN)是CNN实施的新兴替代品,有望提高资源和能源效率。本文解决的主要研究问题是,与CNN等效物相比,SNN加速器是否真正满足了能源需求减少的期望。为此,我们分析了多个SNN硬件加速器的FPGA,以涉及性能和能源效率。我们提出了一种新颖的尖峰事件队列编码方案和一种新型的记忆组织技术,以进一步提高SNN能源效率。这两种技术都已经融入了最先进的SNN体系结构,并对MNIST,SVHN和CIFAR-10数据集进行了评估,以及两个不同尺寸的现代FPGA平台上的相应网络体系结构。对于小型基准(例如MNEST),SNN设计与相应的CNN实施相比,没有相当或很少的延迟和能源效率优势。对于更复杂的基准测试,例如SVHN和CIFAR-10,趋势逆转。
成像方式如今已成为医学中必不可少的诊断工具。从 2009 年到 2019 年,美国的 CT、MRI 和 PET 检查数量分别增加了约 18%、42% 和 105%(1)。这种不断增长的需求已经超过了实际供应,导致法国/欧洲的 MRI 和 PET 扫描不合理地延迟了数周甚至数月(2)。适当的图像去噪可能有助于减少扫描时间,甚至减少 PET 的注射剂量。它可以增加检查次数,而不会影响太多工作时间或需要安装新的医学成像设备。深度学习作为人工智能 (AI) 的一个分支,可以构建有前景的去噪模型。我们专注于 PET 成像,因为它的扫描时间较长,因此去噪效果会更好。尽管许多研究实际上都在研究这种方法的临床表现,但它也可能影响其他新兴领域,如基于成像的预测模型、放射组学和其他 AI 应用 (3)。医学图像基本上是基于其密度 (CT)、磁性 (MRI) 或功能信息 (PET/SPECT) 的不同灰度级的视觉表示。灰度值的分布表征了信息的异质性。一个快速发展的领域称为放射组学,它提供了一种从图像中提取基于强度、形状、纹理的不同特征的方法,以构建预测模型 (4)。这种方法有望预测患者的结果。它们可能允许个性化治疗。例如,在肺癌中计算了一个包括放射组学特征的总体生存预测模型(5)。2013 年至 2018 年间,该领域的发表论文年增长率为 177.82%(6)。这些模型非常有前景,但仍需付出一些努力才能在常规临床环境中转化和实施它们(7)。人工智能在医学成像领域的应用尚处于早期阶段。在本文中,我们使用了深度学习,更具体地说是卷积神经网络方法,它们代表了人工智能技术的一个细分领域。如今,深度学习在图像重建、处理(去噪、分割)、分析和预测建模中发挥着关键作用。这些应用在未来将得到进一步发展(8)。在大多数这些任务中,它们的表现往往优于更传统的方法 ( 9 )。将这种基于 AI 的 PET/MR 去噪算法与临床数据进行比较,发现对比度与噪声比增加了 46.80 ± 25.23%,而仅使用高斯滤波器的对比度与噪声比仅为 18.16 ± 10.02%(10)。在(10)中研究的其他方法,如引导非局部均值、块匹配 4D 或深度解码器,分别将 CNR 提高了 24.35 ± 16.30%、38.31 ± 20.26% 和 41.67 ± 22.28%。也可以在重建期间执行去噪,但这无法在现有机器上实现。最重要的限制是所有这些方法都缺乏 FDA 或 CE 认证。我们的研究重点是 Subtle PET™(Subtle Medical,美国斯坦福,由法国 Incepto 提供)。它是一款经 FDA 和 CE 批准的 FDG PET(11)后处理去噪软件,基于卷积神经网络(CNN),这是最常见的图像处理深度学习架构。
摘要 - 机器学习方法/机器学习的使用对于开发人眼状态的识别非常重要,尤其是脑电图(EEG)信号处理的问题以识别眼睛状态。在先前的研究中,所使用的方法可以是监督学习和无监督学习之间的一种组合方法,以及使用监督学习的单一方法。在这项研究中,脑电图的分类使用一种具有监督学习的方法,使用方法:k-neartemest neghbors(k-nn),随机森林和1D卷积神经网络(1D CNNS)。使用四种尺寸(即精度,回忆,精度和F1得分)测量三种分类方法的性能。从实验结果中获得的是,与所使用的四种尺寸的其他两种方法相比,K-NN方法具有最佳性能,其中每个尺寸的值为:准确性= 82.30%;召回= 82.30%;精度= 82.36%; F1得分= 82.30%。k-nn比其他两种方法更适合分类脑电图,因为数据集中的所有输入属性都有实际数字数据类型。
摘要。目的:本研究的创新之处在于探索了多种脑电波信号数据预处理的新方法,其中提取统计特征,然后根据降维算法选择它们的顺序将其格式化为视觉图像。然后,这些数据被处理为 2D 和 3D CNN 的视觉输入,然后进一步提取“特征的特征”。方法:从三个脑电图数据集得出的统计特征在视觉空间中呈现,并分别在 2D 和 3D 空间中处理为像素和体素。对三个数据集进行了基准测试,即来自四个 TP9、AF7、AF8 和 TP10 10-20 电极的心理注意力状态和情绪价以及来自 64 个电极的眼睛状态数据。通过三种选择方法选择了 729 个特征,以便从相同的数据集中形成 27x27 图像和 9x9x9 立方体。为 2D 和 3D 预处理表示而设计的 CNN 学习从数据中卷积有用的图形特征。主要结果:70/30 分割方法表明,在 2D 中,特征选择分类准确度最高的方法是注意力状态的单一规则和情绪状态的相对熵。在眼部状态数据集中,3D 空间最佳,由对称不确定性选择。最后,使用 10 倍交叉验证来训练最佳拓扑。最终最佳 10 倍结果是注意力状态(2D CNN)97.03%,情绪状态(3D CNN)98.4%,眼部状态(3D CNN)97.96%。意义:本研究提出的框架的结果表明,CNN 可以成功地从一组预先计算的原始 EEG 波的统计时间特征中卷积出有用的特征。 K 折验证算法的高性能表明,除了预先计算的特征之外,CNN 学习到的特征还包含对分类有用的知识。
人类行动识别(HAR)涵盖了监视各个领域的人类活动的任务,包括但不限于医学,教育,娱乐,视觉监视,视频检索以及对异常活动的识别。在过去十年中,HAR领域通过利用卷积神经网络(CNN)和经常性的神经网络(RNN)来有效提取和理解复杂的信息,从而增强了HAR系统的整体性能,从而取得了实质性的进展。最近,计算机视觉的领域见证了视觉变压器(VIT)的启示作为有效的解决方案。超出图像分析的范围,已验证了变压器体系结构的功效,从而将其适用性扩展到了不同的视频相关任务上。值得注意的是,在这一景观中,研究界表现出对HAR的浓厚兴趣,承认其多种效用并在各个领域中广泛采用。本文旨在提出一项涵盖CNN的涵盖调查,鉴于它们在HAR领域的重要性,RNNS对VIT的发展。通过对现有文献进行彻底研究并探索新兴趋势,本研究对该领域的累积知识进行了批判性分析和综合。此外,它还研究了正在进行的开发混合方法的努力。遵循此方向,本文提出了一种新型的混合模型,该模型旨在整合CNN和VIT的固有优势。
在现代全球卫生领域,慢性病,特别是影响大脑和肝脏的慢性病,已成为世界各国面临的主要挑战。世界卫生组织 (WHO) 强调慢性病的日益流行,并指出其影响超过了感染和其他传统健康问题 [1,2]。脑部疾病包括从阿尔茨海默氏症等神经退行性疾病到脑瘤的一系列疾病,肝部疾病则包括从肝硬化到肝炎的多种疾病。这些疾病对个人、家庭和社会产生深远影响,是全球发病率和死亡率的重要原因,每年有数百万人受到其严重后果的影响。预测影响大脑和肝脏等慢性病的复杂性在于影响因素众多,从遗传易感性到环境暴露 [3,4]。早期发现对于管理和潜在缓解这些疾病至关重要,但由于早期症状不明显且往往具有误导性,因此仍然具有挑战性。例如,肝病的早期症状可能表现为单纯的疲劳或轻微的腹部不适,很容易与不太严重的疾病混淆。同样,脑部疾病的早期指标也可能被误认为是正常衰老。物联网(IoT)的出现——一项变革性的技术创新——有望重新定义医疗服务。物联网包含一个庞大的互联设备网络,这些设备无需人工干预即可收集、传输和分析数据,从而开启了医疗诊断和患者护理的新时代 [ 5 , 6 ]。
癫痫发作类型识别对于癫痫患者的治疗和管理至关重要。然而,这是一个耗时耗力的困难过程。随着机器学习算法的进步,自动诊断系统有可能加速分类过程、提醒患者并支持医生做出快速准确的决策。在本文中,我们提出了一种新型多路径癫痫发作类型分类深度学习网络 (MP-SeizNet),它由卷积神经网络 (CNN) 和具有注意机制的双向长短期记忆神经网络 (Bi-LSTM) 组成。本研究的目的是仅使用脑电图 (EEG) 数据对特定类型的癫痫发作进行分类,包括复杂部分性、简单部分性、失神性、强直性和强直阵挛性癫痫发作。EEG 数据以两种不同的表示形式输入到我们提出的模型中。 CNN 接收从 EEG 信号中提取的小波特征,而 Bi-LSTM 接收原始 EEG 信号,以便我们的 MP-SeizNet 能够从癫痫发作数据的不同表示中进行联合学习,从而获得更准确的信息学习。我们利用最大的 EEG 癫痫数据库——天普大学医院 EEG 癫痫发作语料库 TUSZ v1.5.2 评估了所提出的 MP-SeizNet。我们使用三重交叉验证对不同患者数据评估了我们提出的模型,并使用五重交叉验证对癫痫发作数据评估了模型,结果分别获得了 87.6% 和 98.1% 的 F1 分数。