本文介绍了一种新颖的方法,可以使用极端点,即每个对象的最上方,最左侧,最左侧,bottommost和最右点进行学习。这些要点在现代边界框注释过程中很容易获得,同时为预分段提供了强大的线索,因此可以使用盒子监督的方法以相同的注释成本来提高性能。我们的工作将极端点视为真实实例掩盖的一部分,并传播它们以识别潜在的前面和背景点,它们全部用于训练伪标签生成器。然后,发电机给出的伪标签又用于监督我们的最终模型。在三个公共基准测试中,我们的方法大大优于现有的盒子监督方法,以完全监督的对应物进一步缩小了差距。尤其是,当目标对象分为多个部分时,我们的模型会生成高质量的掩码,而以前的盒子监督方法通常会失败。
由于带注释的样本稀缺,病理性脑损伤在图像数据中的复杂表现对监督检测方法提出了挑战。为了克服这个困难,我们将重点转移到无监督异常检测。在这项工作中,我们专门使用健康数据训练所提出的模型,以识别测试期间未见的异常。这项研究需要调查基于三元组的变分自动编码器,以同时学习健康脑数据的分布和去噪能力。重要的是,我们纠正了先前基于投影的方法中固有的一个误解,该误解依赖于这样的假设:图像内的健康区域在重建输出中将保持不变。这无意中暗示了病变图像和无病变图像在潜在空间表示上存在相当大的相似性。然而,这种假设可能并不成立,特别是由于病变区域强度对投影过程的潜在重大影响,特别是对于具有单一信息瓶颈的自动编码器。为了克服这个限制,我们将度量学习与潜在采样分离。这种方法确保病变和无病变输入图像都投影到相同的分布中,特别是无病变投影。此外,我们引入了一个语义引导的门控交叉跳过模块来增强空间细节检索,同时抑制异常,利用解码器更深层中存在的健壮健康大脑表示语义。我们还发现,将结构相似性指数测量作为额外的训练目标可以增强所提模型的异常检测能力。
我们为不依赖于人类反馈的大型语言模型(LLMS)提出了一种新颖的增强学习(RL)框架。相反,我们的方法使用模型本身中的交叉注意信号来获得自我监督的奖励,从而指导对模型策略的迭代微调。通过分析模型在生成过程中如何“参加”输入提示,我们构建了及时的覆盖,重点和连贯性的度量。然后,我们使用这些措施来对候选响应进行排名或评分,提供了奖励信号,鼓励模型产生良好的一致,主题文本。在与标准策略梯度方法的经验比较和合成偏好模型的RL微调中,我们的方法在非RL基线的迅速相关性和一致性方面显示出显着的提高。虽然它尚未与完全监督的RLHF系统的性能相匹配,但它突出了使用最小的人类标记来扩展对齐的重要方向。我们提供了详细的分析,讨论潜在的局限性,并概述了将基于跨注意的信号与较少人类反馈相结合的未来工作。
单眼3D检测(M3D)的目的是从单视图像中进行精确的3D观察定位,该图像通常涉及3D检测框的劳动密集型注释。最近已经研究了弱监督的M3D通过利用许多存在的2D注释来遵循3D注释过程,但通常需要额外的培训数据,例如LiDAR Point Clouds或多视图图像,这些数据会大大降低其在各种应用中的适用性和可用性。我们提出了SKD-WM3D,这是一个弱监督的单眼3D检测框架,利用深度插入以实现M3D,并具有单一视图图像,而无需任何3D注释或其他培训数据。SKD-WM3D中的一个关键设计是一个自我知识的蒸馏框架,它通过融合深度信息并有效地减轻单核场景中固有的深度模棱两可,从而将图像特征转换为3D类似的表示形式,而无需计算上的计算层面。此外,我们设计了不确定性感知的分离损失和梯度定位的转移调制策略,分别促进了知识获取和知识转移。广泛的实验表明,SKD-WM3D明显超过了最新的实验,甚至与许多完全监督的方法相当。
许多基于机器学习的轴突追踪方法依赖于带有分割标签的图像数据集。这需要领域专家的手动注释,这需要大量劳动力,并且不适用于以细胞或亚细胞分辨率对半球或整个脑组织进行大规模脑映射。此外,保留轴突结构拓扑对于理解神经连接和大脑功能至关重要。自监督学习 (SSL) 是一种机器学习框架,允许模型在未注释的数据上学习辅助任务,以帮助完成监督目标任务。在这项工作中,我们提出了一种新颖的 SSL 辅助任务,即为面向拓扑的轴突分割和中心线检测的目标任务重建边缘检测器。我们使用小鼠大脑数据集对三个不同的 SSL 任务进行了 3D U-Nets 预训练:我们提出的任务、预测排列切片的顺序和玩魔方。然后,我们在不同的小鼠大脑数据集上评估了这些 U-Nets 和基线模型。在所有实验中,针对我们提出的任务进行预训练的 U-Net 分别将基线的分割、拓扑保留和中心线检测提高了 5.03%、4.65% 和 5.41%。相比之下,切片排列和魔方预训练的 U-Net 并没有比基线有持续的改进。
胎儿心脏视图的解剖结构检测对于诊断胎儿先天性心脏病至关重要。实际上,不同的Hos-Pitals数据之间存在较大的域间隙,例如由于采集设备的不同而引起的可变数据质量。此外,产科专家提供的准确的符号信息非常昂贵甚至无法使用。本研究探讨了无监督的域自适应胎儿心脏结构检测问题。现有的无监督域自适应观察检测(UDAOD)的方法主要集中在自然场景中的特定物体,例如雾gy的城市景观中,自然场景的结构关系是不确定的。Unlike all previous UDAOD scenarios, we first collected a F etal C ardiac S tructure dataset from two hos- pital centers, called FCS , and proposed a multi-matching UDA approach ( M 3 -UDA ), including H istogram M atching (HM), S ub-structure M atching (SM), and G lobal-structure M atching (GM), to better transfer the在医疗场景中进行UDA检测的解剖结构的拓扑知识。HM减轻由像素转换引起的源和目标之间的域间隙。sm融合了子结构的不同角度信息,以遵循局部拓扑知识,以弥合内部子结构的主要间隙。GM旨在使整个器官的全球拓扑知识与目标域相结合。对我们收集的FCS和Cardiacuda进行了广泛的实验,实验结果表明,M 3 -UDA的表现胜过现有的UDAOD研究。数据集和源代码可在https://github.com/xmed-lab/m3-uda
1。一种自我监督的模型登录方法,仅取决于正面匹配对以改善面部嵌入。2。面部聚类的基于深度学习的相似性度量,该指标会自动适应给定模型的学习嵌入空间。3。不需要任何用户输入参数的全自动视频面聚类算法。4。发布电影脸聚类基准数据集,称为MoviefaceCluster,该数据集提供了电影域中存在的极端挑战的面部聚类场景。
永久牧场可以拥有高植物多样性,包括一些稀有植物。环境影响评估(EIA)法规已适当以保护这种多样性。但是,某些永久性牧场的植物多样性低,生产率较低,并且由对牲畜的古怪性低的杂草草主导。
参考图像分割(RIS)的目的是通过相应的静脉语言表达式精确地分段图像中的对象,但依赖于成本密集的掩码注释。弱监督的RIS因此从图像文本对学习到像素级语义,这是用于分割细粒面罩的挑战。自然而然地提高了分割精度,是用图像分割模型SAM赋予弱监督的RI。尽管如此,我们观察到,简单地整合SAM会产生有限的收益,甚至由于不可避免的噪声而导致性能回归,而过度关注对象部分的挑战和挑战。在本文中,我们提出了一个创新的框架,即P PPT(PPT),与拟议的多源课程学习策略合并,以解决这些挑战。具体来说,PPT的核心是一个点发生器,它不仅可以利用Clip的文本图像对准能力和SAM强大的掩膜生成能力,而且还产生了负点提示,以固有,有效地解决嘈杂和过度的焦点问题。在适当的情况下,我们引入了一种以对象为中心图像的课程学习策略,以帮助PPT逐渐从更简单但精确的语义一致性中学习到更复杂的RIS。实验表明,我们的PPT在MIOU上显着胜过弱监督的技术,分别为11.34%,14.14%和6.97%,分别为6.97%。