焊接过程产生的图像噪声(例如弧光,飞溅和烟雾)给基于激光视觉传感器的焊接机器人带来了巨大的挑战,可以定位焊接接缝并准确地进行自动焊接。当前,基于深度学习的方法超过了灵活性和鲁棒性的传统方法。但是,它们的重大计算成本导致与自动焊接的实时要求不匹配。在本文中,我们对卷积神经网络(CNN)和变压器的有效混合体系结构(称为动态挤压网络(DSNET))进行实时焊接接缝分段。更准确地说,开发了一个轻巧的分割框架,以充分利用变压器结构的优势,而无需显着增加计算开销。在这方面,旨在提高其功能多样性的高效编码器已被设计并导致了编码性能的大幅改进。此外,我们提出了一个插件轻巧的注意模块,该模块通过利用焊接接缝数据的统计信息并引入线性先验来产生更有效的注意力权重。使用NVIDIA GTX 1050TI对焊缝图像进行广泛的实验表明,与基线方法Transunet相比,我们的方法将参数的数量减少了54倍,将计算复杂性降低了34倍,并将推理速度提高33倍。dsnet可实现较高的准确性(78.01%IOU,87.64%骰子)和速度性能(100 fps),其模型复杂性和计算负担较低。该代码可在https://github.com/hackerschen/dsnet上找到。
准确地识别草坪边界是草坪割草机器人的可行操作的基础。当前的草坪边界识别方法依赖于预埋的电缆或通过RTK-GPS定位技术绘制边界。两种方法都容易受到定位错误和环境变化的影响。实时识别基于图像的草坪边界的实时识别可以在路径计划和对草坪割草机器人的边界识别之间形成实时闭环,从而提高了机器人工作的鲁棒性和可靠性。U-NET网络是一个简单的图像分割模型,适用于具有有限计算资源的机器人。但是,草坪的二元分割的结果通常是开放的边界线,这与医学图像中U-NET模型的某些多闭合单元的结果不同。因此,很难将U-NET模型直接应用于准确的草坪分割。考虑到草坪图像的特征和有限的计算资源,本文引入了具有通道空间注意机制和变化的损耗函数的改进的U-NET模型,这更好地解决了草坪边界识别的问题。改进模型的MDICE值为97.7%,比原始U-NET模型高约2%。
摘要 - Interactive分割旨在根据用户提供的点击从图像中提取感兴趣的对象。在现实世界应用中,通常需要分割一系列具有相同目标对象的图像。但是,现有方法通常一次处理一个图像,未能考虑图像的顺序性质。为了克服这一限制,我们提出了一种称为序列提示变压器(SPT)的新方法,该方法是第一个利用顺序图像信息进行交互式分割的方法。我们的模型包括两个关键组成部分:(1)序列提示变压器(SPT),用于从图像,点击和掩码序列中获取信息以提高准确的信息。(2)TOP-K提示选择(TPS)选择SPT的精确提示,以进一步增强分割效果。此外,我们创建ADE20K-SEQ基准测试,以更好地评估模型性能。我们在多个基准数据集上评估了我们的方法,并表明我们的模型超过了所有数据集的最新方法。索引项 - 计算机视觉,交互式图像分割
摘要 - 由于较长的车辆到云通信延迟,因此存在的自动驾驶汽车尚未利用云计算来执行其深度学习的驾驶任务。同时,这些车辆通常配备了资源受限的边缘计算设备,这些设备可能无法实时执行计算密集的深度学习模型。商业移动网络的数据传输速度的提高阐明了将云计算用于自动驾驶的可行性。我们的城市规模的现实世界测量结果表明,车辆可以通过低数据传输延迟的第五代(5G)移动网络部分使用云计算。在本文中,我们介绍了ECSEG的设计和实现,ECSEG是一个边缘云的切换图像分割系统,该系统在边缘和云之间动态切换,以实现基于深度学习的语义分割模型,以实时了解车辆的视觉场景。由于各种因素之间的复杂相互依存关系,包括动态无线通道状况,车辆的运动和视觉场景变化,因此开关决策具有挑战性。为此,我们采用深度强化学习来学习最佳的切换政策。基于现实世界实验和痕量驱动模拟的广泛评估表明,与四种基线方法相比,ECSEG可以实现自动驾驶汽车的卓越图像分割精度。
1 乔治华盛顿大学,华盛顿特区,美国。 2 加州大学伯克利分校电气工程与计算机科学系,加利福尼亚州伯克利,美国。 3 独立研究员,加利福尼亚州圣何塞,美国。 *通讯作者电子邮件:chris.tqy128@outlook.com 摘要。本文讨论了一种改进的脑肿瘤医学图像分割模型,该模型是一种基于U-Net架构的深度学习算法。在传统U-Net的基础上,引入GSConv模块和ECA注意机制来提高模型在医学图像分割任务中的表现。通过这些改进,新的U-Net模型能够更有效地提取和利用多尺度特征,同时灵活地关注重要通道,从而显著提高分割结果。在实验过程中,对改进的U-Net模型进行了系统的训练和评估。通过查看训练集和测试集的损失曲线,我们发现两者的损失值在第八个epoch之后都迅速下降到最低点,然后逐渐收敛并稳定下来。这表明我们的模型具有良好的学习能力和泛化能力。此外,通过监测平均交集比(mIoU)的变化,我们可以看到在第35个epoch之后,mIoU逐渐趋近于0.8并且保持稳定,这进一步验证了模型的有效性。与传统的U-Net相比,基于GSConv模块和ECA注意机制的改进版本在分割效果上表现出明显的优势。特别是在脑肿瘤图像边缘的处理上,改进的模型可以提供更准确的分割结果。这一成果不仅提高了医学图像分析的准确性,也为临床诊断提供了更可靠的技术支持。综上所述,本文提出的基于GSConv模块和ECA注意机制的改进U-Net模型为脑肿瘤医学图像分割提供了一种新的解决方案,其优越的性能有助于提高疾病的检测和治疗效果,在相关领域具有重要意义。未来我们希望进一步探索该方法在其他类型医学图像处理中的应用潜力,推动医学影像的发展。
摘要——我们提出了 Q-Seg,这是一种基于量子退火的新型无监督图像分割方法,专为现有量子硬件量身定制。我们将逐像素分割问题(吸收图像的光谱和空间信息)公式化为图形切割优化任务。我们的方法有效地利用了 D-Wave Advantage 设备的互连量子位拓扑,与现有量子方法相比具有出色的可扩展性,并且优于几种经过测试的最先进的经典方法。对合成数据集的实证评估表明,Q-Seg 的运行时性能优于最先进的经典优化器 Gurobi。该方法还在地球观测图像分割上进行了测试,这是一个具有噪声和不可靠注释的关键领域。在嘈杂的中尺度量子时代,与 Segment Anything 等先进技术相比,Q-Seg 成为现实世界应用的可靠竞争者。因此,Q-Seg 使用可用的量子硬件提供了一种有前途的解决方案,特别是在受到有限标记数据和高效计算运行时间的需求限制的情况下。
由卷积神经网络激励的深度学习在一系列医学成像问题(例如图像分类,图像分割,图像合成等)中非常成功。但是,对于验证和可解释性,我们不仅需要模型做出的预测,而且还需要在做出这些预测时它的自信。这对于人民接受安全的关键应用很重要。在这项工作中,我们使用了基于变异推理技术的编码器解码器结构来分割脑肿瘤图像。我们使用骰子相似性系数(DSC)和联合(IOU)的交集作为评估指标,评估公开可用的Brats数据集的工作。我们的模型能够以原则上的贝叶斯方式考虑脑肿瘤,同时考虑到疾病的不确定性和认知不确定性。
了解野火后被烧毁区域的程度和严重程度是对对Climate变化影响感兴趣的科学家进行研究的重要目标和重点。在我们的项目中,我们使用六个进一步的分割模型来实现这项任务,使用较低分辨率Landsat卫星的遥感图像作为输入和输出分割掩码,以表明图像的哪些部分被燃烧并且未燃烧。我们的模型建立在Pytorch模型库和开源U-NET模型的DeepLabv3分割模型上;我们使用这些模型的预贴版本作为基线,并进一步实验将红外带作为输入和MAE损失函数,旨在减少噪声和低分辨率的影响。我们发现所有方法都达到了高精度,但是除了RGB之外,还包括NIR(近红外)和SWIR(短波输入)频段的5频段模型,对于DeepLabV3和U-NET架构都表现最好。我们的模型在数据集中的加利福尼亚野火方面非常有效,但是我们希望将它们进一步推广到世界其他地区的分布之外的火灾,那里的火灾未有充分记录。这些广告将极大地帮助这些领域的应急准备,野生火灾和气候科学。
○在SoftMax中,添加一个新的数据点使SoftMax的分母散布,这会影响所有概率。○通过添加数据点,SoftMax损耗可能会更改,因为新数据点的正确类的日志概率可能与现有数据点的正确类的日志概率不同。
5倍交叉验证评估结果(1,2)表明,由于电离辐射和基因突变的影响,胶质瘤占中枢神经系统原发性肿瘤的27%(3-6)。胶质瘤的发病率随年龄增长而增加(1,2,6-8),不同级别的胶质瘤发病率不同。根据恶性程度,胶质瘤病理分为I至IV级,其中II级及以下为低级别胶质瘤(LGG),III级及以上为高级别胶质瘤(HGG)(9)。例如,HGG患者的中位生存期(MST)通常小于2年,而患有HGG的HGG患者的MST仅为4至9个月。此外,分子研究已发现了可增强诊断和提供生物标志物的特征(10)。异柠檬酸脱氢酶 1 和 2 (IDH1/2) 突变以及 X 编码蛋白 (ATRX) 和 TP53 突变的存在提示弥漫性星形细胞瘤,而 IDH1/2 突变与 1p19q 缺失相结合则提示少突胶质细胞瘤 (10)。受体酪氨酸激酶基因的局部扩增、端粒酶逆转录酶 (TERT) 启动子突变以及 10 号和 13 号染色体的缺失和 7 号染色体的三体性是胶质母细胞瘤的显著特征,可用于诊断目的 (10)。此外,LGG 中 B-Raf 原癌基因 (BRAF) 基因融合和突变的存在以及 HGG 中组蛋白 H3 的突变的存在也可以作为