心电图(ECG)是一种捕获心脏活动的电测量,是诊断心血管疾病(CVD)的金标准。但是,由于ECG需要使用用户参与,因此不可避免地进行心脏监测。相比之下,光电学(PPG)提供了易于收集的数据,但其精度有限限制了其临床用法。为了确定这两个信号的优势,最近的研究不适合将PPG信号重新构成到ECG的各种深度学习技术;但是,缺乏文本信息以及降低噪声生物医学信号的能力最终会限制模型的影响。在这项研究中,我们提出了一种基于变压器的新型体系结构,可从PPG重建ECG,并将PPG和重建的ECG与CVD检测的多种方式相结合。此方法是第一次在生物医学波形重构上进行了变压器序列到序列转换,并结合了PPG和ECG的优势。我们还创建了基于斑块的注意(SPA),这是一种效率方法,用于编码/解码生物医学波形。通过获取各种序列长度并捕获交叉点连接,SPA最大程度地提高了本地特征和全局上下文反复的信号操作。所提出的体系结构在BIDMC数据库上生成了0.29 RMSE的状态性能,以重新构建PPG到ECG,超过了先前的研究。我们还在模拟III数据集上评估了该模型,在CVD检测中达到了95.9%的精度,并在PPG-BP数据集中评估了该模型,在相关的CVD糖尿病检测中达到了75.9%的精度,表明其一般能力。作为一种概念证明,一种名为Pearl(原型)的耳环可穿戴式可穿戴,旨在扩大护理点(POC)医疗保健系统。
LIDAR UPSMPLING对于机器人和自动驾驶汽车的启示系统来说是一项艰巨的任务,这是由于大型场景的稀疏结构稀疏和不规则的结构。最近的作品建议通过将LIDAR数据从3D欧几里得空间传播到2D图像空间中的一个超级分辨率问题来解决此问题。尽管他们的方法可以生成具有细粒细节的高分辨率范围图像,但由此产生的3D点云是10个模糊细节并预测无效的点。在此pa-per中,我们提出了郁金香,这是一种从低分辨率激光雷达输入中重建高分辨率激光圈云的新方法。我们还遵循一种基于图像的方法,但特定地修改了基于Swin-Transformer网络的贴片和窗口几何形状,以更好地拟合范围图像的特性。我们在三个公共现实世界和模拟数据集上进行了几项实验。郁金香在所有相关指标中都优于最先进的方法,并且比以前的工作生成了强大,更现实的点云。该代码可在https://github.com/ethz-asl/tulip.git上找到。
视觉 - 语言变压器(VLT)最近显示出巨大的成功,但同时伴随着大量的计算成本,其中主要原因可以归因于大量的视觉和语言令牌。存在用于压缩VLTS的令牌修剪研究主要遵循基于单模式的方案,但忽略了对齐不同模态来指导令牌修剪过程的关键作用,从而导致重要的代币在另一个模态分支中错误地修剪一个模态。同时,现有的VLT修剪作品也缺乏基于不同输入样本动态压缩每一层的灵活性。为此,我们提出了一个名为M Ultodal的新颖框架,用于加速变化VLT的木质制成d ynamic t ynamic t oken p Runing(MADTP)。具体来说,我们首先引入了精心设计的多模式对齐指导(MAG)模块,该模块可以使相同语义概念的特征与不同的模式相结合,以确保修剪的代币对所有模式都不太重要。我们进一步设计了一种新型的dy-namic令牌修剪(DTP)模块,该模块可以根据不同的输入实例自适应地调节每个层中的令牌压缩比。对各种基准测试的广泛实验表明,MADTP可以显着确定多种模型的计算复杂性,同时保留竞争性能。值得注意的是,当将MADTP应用于NLVR2数据集中的BLIP模型时,可以将GFLOPS降低80%,而性能降低少于4%。该代码可在https://github.com/double125/madtp上找到。
在这项研究中,我们提出了使用多平面和多层跨前(M3T)网络的三维医学图像分类器,以在3D MRI图像中对阿尔茨海默氏病(AD)进行分类。提出的网络协同委托3D CNN,2D CNN和变压器用于准确的AD分类。3D CNN用于执行本机3D表示学习,而2D CNN用于利用大型2D数据库和2D代表学习的预训练权重。使用具有感应性偏置的CNN网络有效地提取局部大脑中与AD相关的异常的信息信息。跨前网络还用于获得CNN后多平面(轴向,冠状和矢状)和多切片图像之间的注意力关系。也可以使用不感应偏置的变压器学习分布在大脑中较大区域的差异。在此期间,我们使用了来自阿尔茨海默氏病神经影像学计划(ADNI)的训练数据集,该计划总共包含4,786 3D T1加权MRI图像。对于有效数据,我们使用了来自三个不同机构的数据集:澳大利亚成像,生物标志物和生活方式旗舰研究(AIBL)(AIBL),开放访问Imaging研究(OASIS)的开放访问系列(OASIS)以及来自培训数据集中的一些ADNI数据。我们提出的M3T基于曲线(AUC)下的区域(AUC)和AD分类的分类精度,与常规的3D分类网络相结合。这项研究表示,所构成的网络M3T在多机构验证数据库中实现了最高的性能,并证明了该方法有效地将CNN和Transformer用于3D医学图像的可行性。
摘要 — 在三相四线低压配电系统中,不平衡负载会导致中性电流 (NC) 形成环路,从而导致功率损耗增加和中性电位变化。与传统电力变压器相比,智能变压器 (ST) 具有严格的电流限制以避免过流。然而,其在下游低压电网电压调节方面的优势可以提供调节过度 NC 的能力。本文提出了一种闭环 NC 优化控制,一方面,在满足标准 EN 50160 要求的正常运行中最小化 NC 电流,另一方面,在极端情况下抑制 NC 电流以避免 ST 过流损坏。根据曼彻斯特地区三相四线配电网,通过硬件在环设置和基于不平衡负载曲线下的 350kVA、10kV/400V、ST 供电配电网的案例研究,通过实验测试验证了所提出的控制策略。结果清楚地证明了所提出的NC优化控制策略对NC抑制和最小化的有效性和灵活性。
摘要 - 脑肿瘤诊断是一项具有挑战性的任务,但对于计划治疗以停止或减慢肿瘤的生长至关重要。在过去的十年中,卷积神经网络(CNN)在医学图像中肿瘤的自动分割中的高性能急剧增加。最近,与CNN相比,视觉变压器(VIT)已成为医学成像的稳健性和效率的核心重点。在本文中,我们提出了一个新颖的3D变压器,称为3D catbrats,用于基于最先进的SWIN变压器的磁共振图像(MRIS),用于使用残留块和通道注意模块的最先进的SWIN变压器进行磁共振图像(MRI)。在Brats 2021数据集上评估了所提出的方法,并实现了在验证阶段超过当前最新方法的平均骰子相似性系数(DSC)的定量度量。索引项 - CNN,变形金刚,VIT,语义段
森林在地面碳循环中至关重要,并且对它们对持续气候变化的反应的了解对于确定未来的碳浮动和气候轨迹至关重要。在具有对比季节的区域,树木形成可以分配给日历年的离散年环,从而可以提取有关树木对环境的反应的宝贵信息。木材的解剖结构提供了有关树木对气候的反应和适应的高度分辨信息。定量木材解剖结构有助于通过使用木材微剖面的高分辨率图像在细胞水平上测量木材来检索这些信息。然而,尽管在识别细胞结构方面已经取得了很大的进步,但获得有意义的细胞信息仍然受图像上正确的年度树环界定的阻碍。这是一项耗时的任务,需要经验丰富的操作员手动界定环边界。基于像素值的自动分割的经典方法正在用能够区分结构的新方法代替,即使分界需要高水平的专业知识。尽管已使用神经网络进行木环的分割,但木制的木材图像,但阔叶物种染色的微观切片中细胞模式的复杂性需要自适应模型才能准确地完成此任务。我们在山毛榉核心染色的横截面微隔板图像上使用神经网络提出了自动树环边界划定。基于卷积神经网络的应用我们训练了一个UNETR,一个UNET的联合神经网络和视觉变压器的注意机制,以自动分段年度环边界。考虑到具有手动分割的差异以及数量木材解剖学分析目标的差异以及差异的后果。在大多数情况下(91.8%),自动分割匹配或改进了手动细分,即使将手动细分视为更好的情况,两种类别之间的船只分配率也相似。
摘要:本文解决了香草视觉变压器中与多头自我注意(MHSA)相关的高计算/空间复杂性。为此,我们提出了层次MHSA(H-MHSA),这是一种新颖的方法,以层次的方式计算自我注意力。具体来说,我们首先将输入图像分为通常完成的补丁,每个补丁都被视为令牌。然后,提议的H-MHSA学习本地贴片中的令牌关系,作为局部关系建模。然后,将小斑块合并为较大的贴片,H-MHSA对少量合并令牌的全局依赖性建模。终于,将本地和全球专注的特征汇总为具有强大表示能力的功能。由于我们仅在每个步骤中计算有限数量的令牌的注意力,因此计算负载大大减少。因此,H-MHSA可以在不牺牲细粒度信息的情况下有效地模拟令牌之间的环境关系。与H-MHSA模块合并,我们建立了一个基于层次的变压器网络的家族,即HAT-NET。为了证明帽子网络在场景中的优越性,我们就基本视觉任务进行了广泛的实验,包括图像分类,语义分割,对象titection和实例分段。因此,HAT-NET为视觉变压器提供了新的视角。代码和预估计的模型可在https://github.com/yun-liu/hat-net上找到。
最近,有效的视觉变压器表现出出色的性能,并且在资源受限的范围内延迟较低。通常,他们在宏观水平上使用4×4贴片嵌入式和4阶段结构,同时在微观级别利用多头配置的同时注意力。本文旨在解决记忆效率高的人中所有设计级别的计算重复。我们发现,使用较大的修补茎不仅降低了内存访问成本,而且还通过利用令牌表示,从早期阶段降低了空间冗余,从而实现了态度性能。fur-hoverore,我们的初步分析表明,在早期阶段的注意力层可以用会议代替,并且后期阶段的几个注意力头在计算上是多余的。为了处理这一点,我们介绍了一个单头注意模块,该模块固有地预先预先冗余,并同时通过相结合的全局和本地信息来提高准确性。在解决方案的基础上,我们引入了Shvit,这是一种单头视觉变压器,获得了最先进的速度准确性权衡。例如,在ImagEnet-1k上,我们的SHVIT-S4在GPU,CPU和iPhone12移动设备上比MobileVitV2×1.0快3.3×,8.1×和2.4倍,而同时更准确。用于使用Mask-RCNN头对MS Coco进行的对象检测和实例分割,我们的模型分别在GPU和移动设备上表现出3.8×和2.0×下骨架潜伏期时,可以与FastVit-SA12进行比较。