基于实例的学习理论(IBLT)建议Humans通过积累经验,以决策任务特征,执行的动作以及决策结果的实用性来学习动态决策任务。该理论已应用于在各种情况下基于实例的学习模型(IBL)模型。所有IBL模型应用程序的一个关键功能是累积基于实例的内存和基于识别识别的检索的方法。在几乎没有功能的简单任务中,可以假设使用所有相关信息来假设这些知识代表和检索。但是,当详尽的特征枚举不可行时,这些方法不能很好地扩展到复杂的任务。这要求认知建模者设计状态特征的任务特定表示以及相似性指标,这些指标可能很耗时,并且无法推广到相关任务。为了解决这个问题,我们利用人工神经网络(特别是常规模型(GMS))中的最新广告来学习复杂的动态决策制定任务的表示,而无需依赖领域知识。我们评估了一系列GM在形成表示代表方面的有用性,这些代表可以被IBL模型用于预测复杂决策任务中的人类行为。这项工作通过使用GMS形成表示形式并确定相似性来连接生成和认知模型。
摘要 目前,深度学习(DL)被广泛用于解决非常复杂的任务。然而,DL模型的训练需要庞大的数据集和漫长的训练时间。我们引入了一种新颖的量子实例选择(IS)方法,该方法将训练数据集的大小减少了多达 28%,同时保持了有效性,提高了训练效率和可扩展性。我们的方法利用量子退火(QA),一种特定的量子计算范式,可以解决优化问题。这是首次尝试使用 QA 解决 IS 问题,我们为其提出了一种新的二次无约束二元优化(QUBO)公式。对多个自动文本分类(ATC)数据集进行的大量实验表明,我们的解决方案是可行的,并且与当前最先进的 IS 解决方案具有竞争力。
胃肠道:喉咙痛;口腔粘膜的损伤和溃疡具有食道钻孔的可能性(取决于配方中的摄入量和表面活性剂的摄入量和表面活性剂);粘膜红斑,吞咽困难,表腹性恶心,呕吐,腹泻和腹痛,可能进化为脱水,消化性出血和麻痹性回肠12,17-26;
模型 BERT BERT 6B Dense Dense Dense ViT ViT ViT ViT ViT 微调预训练 Transf。 121 169 201 微型 小型基础 大型 巨型 GPU 4 · V100 8 · V100 256 · A100 1 · P40 1 · P40 1 · P40 1 · V100 1 · V100 1 · V100 4 · V100 4 · V100 小时 6 36 192 0.3 0.3 0.4 19 19 21 90 216 千瓦时 3.1 37.3 13,812.4 0.02 0.03 0.04 1.7 2.2 4.7 93.3 237.6 表 2. 对于我们分析的 11 个模型:GPU 的类型、该类型的 GPU 数量、小时数以及所用的能量(千瓦时)。例如,我们的 BERT 语言建模 (BERT LM) 实验使用了 8 个 V100 GPU,持续了 36 个小时,总共使用了 37.3 千瓦时。我们注意到,60 亿参数转换器的训练运行时间仅为训练完成时间的约 13%,我们估计完整的训练运行将消耗约 103,593 千瓦时。
脑肿瘤分割是医学图像分析中对于患者准确诊断和治疗的关键步骤。传统的肿瘤分割方法通常需要大量的手动操作,并且容易出现差异。在本研究中,我们提出了一种使用 Mask R-CNN 进行脑肿瘤分割的自动化方法,Mask R-CNN 是一种最先进的深度学习实例分割模型。我们的方法利用 MRI 图像来高精度地识别和描绘脑肿瘤。我们在带注释的 MRI 图像数据集上训练了 Mask R-CNN 模型,并使用平均精度 (mAP) 指标评估了其性能。结果表明,我们的模型实现了 90.3% 的高 mAP,表明其在准确分割脑肿瘤方面的有效性。这种自动化方法不仅减少了肿瘤分割所需的手动操作,而且还提供了一致可靠的结果,有可能改善临床结果。
自学学习(SSL)是一种无监督的表示技术,是深度学习中的热门话题。它涉及解决一个人工任务,该任务允许网络学习数据集的语义。然后可以使用所得的特征提取器进行传输学习,以减少解决实际下游任务所需的标记示例数量。这对于计算机辅助诊断具有巨大的实用价值,因为标签需要医学专家,这很昂贵[1]。SSL方法通常应用于图像补丁(例如拼图求解[2],上下文预测[3],对比度学习[4]或视觉变压器[5]),而下游任务通常与整个图像一起使用。此差异要求在两个单独的顺序步骤中实现SSL并转移学习。一种固有地使用补丁的技术是多个实例学习[6],因此对于许多SSL方法而言,可能是更自然的选择。
摘要。预测隐藏在com-plex上下文中的对象的实例级掩码是伪装实例分割(CIS)的目标,这一任务因伪装的obs obsptss and Anckatiks之间的惊人相似之处而复杂。伪装观察的各种外观,包括不同的角度,部分可见性和模棱两可的信息,进一步加剧了这一挑战。先前的作品考虑在高不确定性区域内clasifulsiful sifialpixels,而无需考虑其文本语义,从而导致许多假阳性。我们提出了一种称为Mask2Camouflage的新颖方法,该方法同时增强了上下文特征的建模,并完善了实例级别的预测地图。mask2Camouflage利用多尺度功能集成了骨干线中提取的功能。然后,引入了全局细化的交叉注意模块(GCA),以补充前景面罩和背景掩盖,以减少假阳性。fur-hoverore,通过模拟全球换档聚类过程,我们介绍了全球偏移的多头自我注意力(GSA),该过程使对象查询不仅可以从早期功能中捕获信息,还可以从结构性概念中捕获信息,从而降低与评估的数据验证的掩体对象检测任务中的类内部问题。与15种最先进的方法相比,我们的Mask2Camouflage显着提高了伪装实例细分的性能。我们的代码可在https://github.com/underlmao/mask2camouflage上找到。
文本到图像扩散生成模型可以以繁琐的及时工程为代价产生高质量的图像。可以通过引入布局条件来提高可控性,但是现有方法缺乏布局编辑能力和对对象属性的细粒度控制。多层生成的概念具有解决这些局限性的巨大潜力,但是同时生成图像实例与场景组成限制了控制对细粒对象属性的控制,在3D空间和场景操作能力中相对定位。在这项工作中,我们提出了一种新型的多阶段生成范式,该范式专为细粒度的控制,灵活性和互动性而设计。为了确保对实例属性的控制,我们设计了一个新颖的训练范式,以使扩散模型适应带有透明度信息的RGBA图像,以生成孤立的场景组件。为了构建复杂的图像,我们采用了这些预生成的实例,并引入了一个多层复合生成过程,该过程平滑地组件在现实的场景中。我们的实验表明,我们的RGBA扩散模型能够生成具有对对象属性的精确控制的多样化和高质量实例。通过多层组成,我们证明了我们的方法允许从高度复杂的提示中构建和操纵图像,并通过对物体外观和位置进行精细的控制,从而获得比竞争方法更高的控制程度。
摘要。监视系统的兴起导致收集的数据呈指数增长,从而在深度学习方面有了一些进步来利用它们并自动化自治系统的任务。车辆检测是智能车辆系统和智能运输系统领域的关键任务,使得控制交通密度或检测事故和潜在风险是可能的。本文提出了一个最佳的元方法,可以应用于任何即时分割模型,例如蒙版R- CNN或yolact ++。使用这些模型和超分辨率获得的初始检测,进行了优化的重新指导,允许检测未鉴定的元素并提高其余检测的质量。超分辨率的直接应用是有限的,因为实例分割模型根据固定维度处理图像。因此,如果超过超过该固定尺寸的尺寸,该模型将再次重新汇总,从而失去所需效果。这种元方法的优点主要在于不需要修改模型体系结构或重新培训它。无论给出的输入的图像的大小如何,都将生成符合对象分割模型定义维度的超级分辨区域。应用我们的建议后,实验显示了CityScapes数据集Jena序列中使用的Yolact ++模型的提高高达8.1%。
摘要 - 在移动医疗保健和远程诊断中,核分割是病理分析,诊断和分类的关键步骤,需要实时处理和高准确性。然而,核大小,模糊轮廓,不均匀染色,细胞聚类和重叠的细胞的变化阻碍了精确的分割。此外,现有的深度学习模型通常以增加复杂性的成本优先考虑准确性,从而使其不适合资源有限的边缘设备和现实世界部署。为了解决上述问题,我们提出了一个边缘感知的双分支网络,用于核实例分割。网络同时预测目标信息和目标轮廓。在网络中,我们提出了一个上下文融合块(CF-block),该融合块有效地从网络中提取和合并了上下文信息。加法 - 我们引入了一种后处理方法,该方法结合了目标信息和目标轮廓,以区分重叠的核并生成实例分割图像。进行了广泛的定量评估,以评估我们方法的性能。实验结果表明,与BNS,Monuseg和CPM-17数据集的最新方法相比,该方法的出色性能。索引术语 - 努塞鲁斯细分,移动医疗保健,实体细分,医学成像,双支分支网络