在当代背景下,加强安全和安全措施的必要性变得越来越明显。鉴于技术进步的快速发展,智能和有效的监视解决方案的发展引起了人们的极大兴趣,尤其是在智慧城市(SC)领域。监视系统已随着边缘技术(ET)的出现,物联网(IoT)和深度学习(DL)的出现而改变,以成为SC的关键组成部分,尤其是面部识别的领域(FR)。这项工作推出了基于ESP32-CAM微控制器的智能监视汽车机器人,再加上结合了DL模型和传统算法的FR模型。使用HAAR-CASCADE(HC)算法进行面部检测,而特征提取依赖于提议的卷积神经网络(CNN)和预测的DL模型,即VGG和Resnet。分类是通过两种不同的算法进行的:天真的贝叶斯(NB)和K-Nearest邻居(KNN)。验证实验证明了包括HC,VGG和KNN的复合模型的优势,分别在LFW,AR和ORL数据库中达到了92.00%,94.00%和96.00%的准确率。此外,监视汽车机器人表现出实时响应能力,包括电子邮件警报通知,并在自定义数据库中拥有99.00%的出色识别精度率。此ET监视解决方案提供了能源效率,便携性,远程可访问性和经济负担能力的优势。
使用人工智能辅助图像分类器对初级内镜医师进行胃病变组织学预测培训的初步效果。方法 在具有五个卷积层和三个完全连接层的卷积神经网络上构建人工智能图像分类器,通过 2,000 个未放大的内镜胃图像训练 Resnet 主干。独立验证集由来自 100 个胃病变的另外 1,000 个内镜图像组成。六名初级内镜医师审查了验证集的第一部分,然后向其中三名(A 组)披露人工智能的预测,而其余三名(B 组)未提供此信息。所有内镜医师都独立审查了验证集的第二部分。结果 AI 的总体准确率为 91.0 %(95 % CI:89.2 – 92.7 %),敏感度为 97.1 %(95 % CI:95.6 – 98.7 %),特异度为 85.9 %(95 % CI:83.0 – 88.4 %),ROC 曲线下面积 (AUROC) 为 0.91(95 % CI:0.89 – 0.93)。在两个验证集中,AI 的准确度和 AUROC 均优于所有初级内镜医师。在第二个验证集中,A 组内镜医师的表现有所提高,但 B 组内镜医师没有提高(准确度为 69.3 % 到 74.7 %;P = 0.003)。结论 训练后的 AI 图像分类器可以准确预测胃病变中是否存在肿瘤成分。人工智能图像分类器的反馈还可以加快初级内窥镜医师预测胃病变组织学的学习曲线。
人工智能(AI)被定义为人工实体为解决复杂问题而表现出的智能,通常被认为是计算机或机器的系统(Kumar等,2012)。随着大数据的出现和计算能力的提升,机器学习、人工神经网络和深度学习(Gao等,2022;Song等,2022;Gao等,2023)近年来发展迅速并不断融合其他学科,在理论和应用上取得了巨大成功(Chaturvedula等,2019;Brown等,2020;Woschank等,2020;Alzubaidi等,2021;Mohsen等,2023)。图1展示了AI与机器学习、人工智能、深度学习等相关概念之间的关系。同时,图1还展示了人工智能在药理学研究中的应用。人工智能的发展可以追溯到20世纪40年代,其历史进程和发展已在之前的许多综述中详细描述(Muggleton,2014;Haenlein and Kaplan,2019)。近几十年来,卷积神经网络(CNN)、循环神经网络(RNN)、图神经网络(GNN)和深度神经网络(DNN)(Gao et al., 2021; Lai et al., 2022)等神经网络的广泛应用,以及 ResNet(He et al., 2015; Zhang et al., 2024)、Attention 和 Transformer(Vaswani et al., 2017; You et al., 2022b)等深度学习算法的发展,推动了神经网络和深度学习的发展,并进一步优化了人工智能算法在各个领域的应用性能(Alzubaidi et al., 2021)。图 2 简要摘录并展示了人工智能发展过程中提出的最重要的算法。
深度神经网络 (DNN) 是图像、语音和文本处理的最新技术。为了解决训练时间长和能耗高的问题,自定义加速器可以利用稀疏性,即零值权重、激活和梯度。提出的稀疏卷积神经网络 (CNN) 加速器支持使用不超过一个动态稀疏卷积输入进行训练。在现有的加速器类别中,唯一支持双面动态稀疏性的是基于外积的加速器。然而,当将卷积映射到外积时,会发生与任何有效输出都不对应的乘法。这些冗余笛卡尔积 (RCP) 降低了能源效率和性能。我们观察到在稀疏训练中,高达 90% 的计算都是 RCP,它们是由 CNN 训练后向传递期间大矩阵的卷积产生的,用于更新权重。在本文中,我们设计了一种机制 ANT 来预测和消除 RCP,与外积加速器结合使用时可以实现更高效的稀疏训练。通过预测超过 90% 的 RCP,在使用 DenseNet- 121 [ 38 ]、ResNet18 [ 35 ]、VGG16 [ 73 ]、Wide ResNet (WRN) [ 85 ] 和 ResNet-50 [ 35 ] 的 90% 稀疏训练中,ANT 比类 SCNN 加速器 [67] 实现了 3.71 倍的几何平均速度提升,能耗降低了 4.40 倍,面积增加了 0.0017 平方毫米。我们将 ANT 扩展到稀疏矩阵乘法,以便同一个加速器可以预测稀疏全连接层、Transformer 和 RNN 中的 RCP。
磁共振成像(MRI)自动脑肿瘤分割的主要任务是自动分割脑肿瘤水肿,腹部水肿,内窥镜核心,增强肿瘤核心和3D MR图像的非增强肿瘤核心。由于脑肿瘤的位置,大小,形状和强度差异很大,因此很难自动分割这些脑肿瘤区域。在本文中,通过结合Densenet和Resnet的优点,我们提出了一个新的3D U-NET,具有密集的编码器块和残留的解码器块。我们在编码器部分中使用了密集的块和解码器部分中的残留块。输出特征图的数量随编码器的收缩路径中的网络层增加而增加,这与密集块的特征一致。使用密集的块可以减少网络参数的数量,加深网络层,增强特征传播,减轻消失的梯度和扩大接收场。在解码器中使用残差块来替换原始U-NET的卷积神经块,这使网络性能更好。我们提出的方法在BRATS2019培训和验证数据集上进行了培训和验证。我们在BRATS2019验证数据集上分别获得了整个肿瘤,肿瘤核心和增强肿瘤核心的骰子得分,分别为0.901、0.815和0.766。我们的方法比原始的3D U-NET具有更好的性能。我们的实验结果表明,与某些最新方法相比,我们的方法是一种竞争性的自动脑肿瘤分割方法。
摘要:脑肿瘤是细胞发育不正常的结果。它是全球成年人死亡的主要原因。早期发现脑肿瘤可以避免许多死亡。用于早期脑肿瘤诊断的磁共振成像(MRI)可以提高患者的生存机会。诊断脑肿瘤的最常用方法是 MRI。MRI 中恶性肿瘤的可见性提高使治疗更容易。脑癌的诊断和治疗取决于其识别和治疗。过去十年中提出了许多深度学习模型,包括 Alexnet、VGG、Inception、ResNet、DenseNet 等。所有这些模型都是在庞大的数据集 ImageNet 上训练的。这些通用模型具有许多参数,在针对特定问题实施这些模型时,这些参数变得无关紧要。本研究使用自定义深度学习模型对脑部 MRI 进行分类。提出的疾病和空间注意力模型(DaSAM)有两个模块; (a) 疾病注意模块 (DAM),用于区分图像的疾病区域和非疾病区域;(b) 空间注意模块 (SAM),用于提取重要特征。所提出的模型的实验在两个公开的多类数据集 Figshare 和 Kaggle 数据集上进行,分别达到了 99% 和 96% 的准确率。所提出的模型还使用跨数据集验证进行了测试,在 Figshare 数据集上训练并在 Kaggle 数据集上验证时达到了 85% 的准确率。DAM 和 SAM 模块的结合实现了特征映射功能,这对于在模型的决策过程中突出显示重要特征非常有用。
腹腔镜胆囊切除术 (LC) 是切除胆囊的标准手术。虽然该手术已发展成为一种相对安全且可耐受的日间手术,但有时可能会很困难,并且可能会出现并发症。复杂的胆结石疾病,如胆囊炎或胆结石性胰腺炎,是增加 LC 技术难度的危险因素。虽然可以对手术难度进行术前预测,但围手术期发现可能会令人惊讶。使用基于 AI 的模型了解手术场景的难度对于对手术性能进行基准测试和改进手术室规划非常重要。本研究旨在开发一种深度学习 (DL) 来预测腹腔镜胆囊切除术在特定手术发现上的难度。基于 Nassar 评分使用了难度分级量表。为了训练 DL 网络,从录制的视频中提取了帧。所有帧均标记为“胆囊”难度 1-3 级和“粘连”难度 1-3 级。排除由体外图像组成或胆囊不可见的帧。总共有 26.483 帧。ResNet 用作模型的主干。调整超参数以改善模型结果。多类和二元分类网络都经过了训练。训练用于分类胆囊难度(3 级)的网络比训练用于分类粘连难度的网络表现更好(准确率 74%)。可以对胆囊炎进行分类,准确率为 91%,对简单病例进行分类,准确率为 87%。本研究结果可作为进一步研究 LC 难度分类的起点。这是提高对手术场景理解并为 LC 外科医生提供基准的第一步。
摘要 —分布式训练可以促进大型医学图像数据集的处理,并在保护患者隐私的同时提高疾病诊断的准确性和效率,这对于实现高效的医学图像分析和加速医学研究进展至关重要。本文提出了一种创新的医学图像分类方法,利用联邦学习 (FL) 来解决数据隐私和高效疾病诊断的双重挑战。传统的集中式机器学习模型尽管广泛用于疾病诊断等医学成像任务,但由于患者数据的敏感性,引发了严重的隐私问题。作为替代方案,FL 成为一种有前途的解决方案,它允许在本地客户端之间训练集体全局模型而无需集中数据,从而保护隐私。本研究重点关注 FL 在磁共振成像 (MRI) 脑肿瘤检测中的应用,证明了联邦学习框架与 EfficientNet-B0 和 FedAvg 算法相结合在增强隐私和诊断准确性方面的有效性。通过精心选择预处理方法、算法和超参数,以及对各种卷积神经网络 (CNN) 架构的比较分析,该研究发现了图像分类的最佳策略。实验结果表明,EfficientNet-B0 在处理数据异质性方面优于 ResNet 等其他模型,并且实现了更高的准确率和更低的损失,凸显了 FL 在克服传统模型局限性方面的潜力。该研究强调了解决数据异质性的重要性,并提出了进一步的研究方向,以扩大 FL 在医学图像分析中的适用性。
摘要 :传统脑机系统复杂、昂贵,情绪分类算法缺乏对脑电信号不同通道间内在关系的表征,准确率还有提升空间。为降低脑电研究门槛,充分利用多通道脑电信号中蕴含的丰富信息,提出并实现一个简便易用的脑机系统,用于快乐、忧伤、悲痛、平静四种情绪的分类。该系统采用卷积注意机制与完全预激活残差块的融合,即基于注意卷积的预激活残差网络(ACPA-ResNet)。在硬件采集和预处理阶段,我们采用ADS1299集成芯片作为模拟前端,利用ESP32单片机对脑电信号进行初步处理。数据通过UDP协议无线传输到PC机进行进一步的预处理。在情绪分析阶段,ACPA-ResNet能够自动从脑电信号中提取和学习特征,通过学习时频域特征实现对情绪状态的准确分类。ACPA-ResNet在残差网络的基础上引入注意力机制,自适应地为每个通道分配不同的权重,使其在空间和通道维度上关注更有意义的脑电信号,同时避免了深度网络架构带来的梯度弥散和爆炸问题。经过对16名受试者的测试,系统实现了稳定的脑电信号采集和传输。新网络显著提高了情绪识别的准确率,平均情绪分类准确率达到95.1%。
我们介绍了几种概率量子算法,这些算法通过利用单位线(LCU)方法的线性组合(LCU)方法来克服量子机学习中正常的单一重复。是残留网络(RESNET)的量子本机实现,在其中我们表明,变异ansatz层之间的残留连接可以防止模型中含有贫瘠的高原,否则将包含它们。其次,我们使用单量子器控制的基本算术运算符对卷积网络的平均合并层实现量子类似物,并表明LCU成功概率对于MNIST数据库仍然稳定。此方法可以进一步推广到卷积过滤器,而使用指数较少的受控单位与以前的方法相比。最后,我们提出了一个通用框架,用于在量子编码的数据上应用不可还原子空间投影的线性组合。这使量子状态可以保持在指数较大的空间内,同时选择性地放大了特定的子空间相对于其他子空间,从而减轻了完全投射到多个多个尺寸的子空间时出现的模拟性问题。与非不变或完全置换不变的编码相比,我们证明了对部分扩增置换不变的点云数据的提高分类性能。我们还通过schur-weyl二元性展示了一种新颖的旋转不变编码,用于点云数据。这些量子计算框架都是使用LCU方法构建的,这表明可以通过使用LCU技术创建进一步的新型量子机学习算法。