从一组线段中自动识别结构是一项挑战,因为并非所有定义建筑结构的线都能被低级图像处理完美检测到。使问题进一步复杂化的是,额外的边缘可能会位于墙壁表面或不属于目标结构的物体上。因此,大多数现有方法依赖于中级区域特征,如几何上下文和方向图 [7],作为布局估计的中间步骤。给定一张图像,我们确定其信息边缘图,然后用它来预测该图像的最佳拟合 3D 框。由于图像是现实世界的投影,因此最好以能够满足现实世界的方式来解释它们。大多数室内环境符合曼哈顿世界假设 [2],即大多数平面位于三个相互正交的方向之一。寻找建筑结构分三步完成;找到线段和消失点,创建许多合理的建筑模型假设,并根据方向图(区域方向的局部信念图)对每个假设进行测试,以
从一组线段中自动识别结构是一项挑战,因为并非所有定义建筑结构的线都能通过低级图像处理完美检测到。为了进一步复杂化问题,额外的边缘可能位于墙壁表面甚至不属于目标结构的物体上。出于这个原因,大多数现有方法依赖于中级区域特征,例如几何上下文和方向图 [7],作为布局估计的中间步骤。给定一张图像,我们确定其信息边缘图,然后使用它来预测图像的最佳拟合 3D 框。由于图像是现实世界的投影,因此最好仅以能够满足现实世界的方式来解释它们。大多数室内环境都符合曼哈顿世界假设 [2],即大多数平面位于三个相互正交的方向之一。查找建筑结构分为三个步骤;找到线段和消失点,创建许多合理的建筑模型假设,并根据方向图(即区域方向的局部信念图)对每个假设进行测试,以便
最近的大型语言模型 (LLM),例如 ChatGPT,在提供特定指令时已经能够生成类似人类的流畅响应。在承认技术进步带来的便利的同时,教育工作者也担心学生可能会利用 LLM 完成写作作业并将其冒充为原创作品。尽管许多 AI 内容检测研究都是由于这种担忧而开展的,但大多数先前研究将 AI 内容检测建模为分类问题,假设文本要么完全由人类编写,要么完全由 AI 生成。在这项研究中,我们在一个很少探索但现实的环境中调查了 AI 内容检测,其中要检测的文本由人类和生成性 LLM 协作编写(为简单起见称为混合文本)。我们首先将检测任务形式化为从给定的混合文本中识别人类编写的内容和 AI 生成的内容之间的过渡点(边界检测)。我们通过从学生写的原始文章中随机删除部分句子,然后指示 ChatGPT 填写不完整的文章,构建了一个混合文章数据集。然后我们提出了一种两步检测方法,其中(1)在编码器训练过程中将 AI 生成的内容与人类编写的内容分开;(2)计算每两个相邻原型之间的距离(原型是嵌入空间中混合文本中一组连续句子的平均值),并假设两个相邻原型之间存在边界,这些原型彼此距离最远。通过大量实验,我们观察到以下主要发现:(1)所提出的方法在不同的实验设置中始终优于基线方法;(2)编码器训练过程(即上述两步方法的第一步)可以显着提高所提出方法的性能; (3)在检测单边界混合型文章的边界时,通过采用相对较大的原型大小(即计算原型所需的句子数量),可以增强所提出的方法,从而使域内评估的结果提高了 22%(相对于最佳基线方法),域外评估的结果提高了 18%。
摘要 - 植物遗传疾病主要影响妇女,并成为一个公共卫生问题,尽管他们的病理生理学仍然知之甚少。作为主要的器官经历了针对病理学的运动和变形,动态MRI是现在的放射科医生的金标准。器官边界,器官形状的受试者间变异性和病理畸形使得段难以执行。为了开发一个朝着病理分级的成像软件,器官边界的MRI分割的准确性是一个关键标准。自动方法尚未足够准确,无法替代强制性的手动分割步骤。已经开发了使用完全卷积神经网络(FCN)的自动分割方法,但通常用于训练的损耗功能通常不足以适合器官边界检测。我们提出了一个专门用于器官边界检测的损失函数,以增强训练,从而提高结果准确性。使用基线U-NET体系结构[1]对Dynamic 2D MRI的膀胱分割进行了评估该方法。结果表明,与广泛使用的骰子损失相比,我们的边界损失函数以及骰子损失的使用优于现有方法,并提高了分割精度。索引项 - 图像分割,完全卷积的网络,混合损失,距离损失,动态MRI,骨盆
我们描述了一种新方法,用于从单个未校准图像中自动检测与建筑物立面相关的消失点和组线。准确的建筑物消失点检测对于建筑物立面校正和 3D 场景重建非常重要。挑战来自于令人困惑的场景杂乱、遮挡、不寻常的建筑形状和非曼哈顿街道布局。建筑物通常具有许多直线特征,例如窗户和门开口,以及它们的整体轮廓。我们利用这些特征并提出了一种强大的线分组技术。该方法在来自 Zubud-Zurich 建筑数据库的图像上进行了评估。实验表明,所提出的方法适用于不同的建筑结构和图像条件,并能过滤掉“非建筑物”消失点(例如从道路边界检测到的消失方向)。
我们提出了一种流程,从稀疏范围激光扫描获得的点云中重建建筑物的完整几何形状。由于室外环境的可达性有限,对建筑物的每个面进行完整、充分的扫描往往是不可能的。我们的流程处理由平面构成的建筑,并根据不完整的扫描忠实地构建一个低复杂度的多面体。该流程首先根据点云识别平面区域,然后继续计算平面交点和角 1 ,最后生成完整的多面体。在流程中,设计了几种基于多面体几何假设的算法来执行数据聚类、边界检测和面提取。我们的系统提供了一个方便的用户界面,但最大限度地减少了用户干预的必要性。我们通过模拟真实的建筑物来展示我们系统的能力和优势。
摘要:奥氏体347H不锈钢提供了极端操作条件(例如高温)所需的出色的机械性能和耐腐蚀性。由于组成和过程变化而导致的微观结构的变化有望影响其特性。识别微观结构特征(例如晶界)因此成为过程微观结构 - 循环中的重要任务。应用基于卷积神经网络(CNN)的深度学习模型是一种强大的技术,可以自动以自动化方式从材料显微照片中检测特征。与微观结构分类相反,分割任务的监督CNN模型需要像素的注释标签。但是,分割任务的图像的手动标记为在合理的时间范围内以可靠且可重复的方式生成培训数据和标签的主要瓶颈。尤其是,要通过更换合金组成来更快的材料发现,需要加快微观结构表征。在这项研究中,我们试图通过利用多模式显微镜直接生成标签而不是手动标记来克服此类局限性。我们将347H不锈钢的扫描电子显微镜(SEM)作为训练数据和电子反向散射衍射(EBSD)显微照片作为晶粒边界检测作为语义分割任务的像素标签。通过考虑一组深CNN体系结构来评估我们方法的生存能力。此外,我们发现幼稚的像素分割会导致较小的间隙和预测的晶界图中缺少边界。我们证明,尽管在两种模式之间的数据收集过程中产生了仪器漂移,但该方法在使用手动标记的类似分割任务中执行了相当的性能。通过在模型训练期间合并拓扑信息,晶粒边界网络和分割性能的连通性得到改善。最后,通过对下游任务的准确计算来预测潜在的谷物形态分布,这是微观结构表征的最终感兴趣。
摘要背景:最近,计算机断层扫描 (CT) 制造商已经开发出基于深度学习的重建算法来弥补迭代重建 (IR) 算法的局限性,例如图像平滑和空间分辨率对对比度和剂量水平的依赖性。目的:评估人工智能深度学习重建 (AI-DLR) 算法与混合 IR 算法对胸部 CT 图像质量和剂量减少的影响,对比不同临床适应症。方法:在用于胸部 CT 条件的五个剂量水平 (CTDI vol: 9.5/7.5/6/2.5/0.4 mGy) 下对 CT 美国放射学会 (ACR) 464 和 CT Torso CTU-41 体模进行采集。使用滤波反投影、两级 IR(iDose 4 级别 4 (i4) 和 7 (i7))和五级 AI-DLR(精确图像;更平滑、平滑、标准、清晰、更清晰)重建原始数据。计算了噪声功率谱 (NPS)、基于任务的传递函数和可检测性指数 (d ′):d ′ 模型检测软组织纵隔结节(纵隔内的低对比度软组织胸部结节 [LCN])、毛玻璃影 (GGO) 或高对比度肺 (HCP) 病变。两名放射科医生独立评估胸部拟人幻影图像的主观图像质量。他们使用常用的四或五分量表评估了纵隔图像的图像噪声、图像平滑度、纵隔血管与脂肪之间的对比度、实质图像的支气管与肺实质之间的视觉边界检测以及整体图像质量。结果:从标准到平滑水平,平均而言,噪声幅度降低(所有剂量水平:纵隔图像为 - 66.3% ± 0.5%,实质图像为 - 63.1% ± 0.1%),平均 NPS 空间频率降低(所有剂量水平:纵隔图像为 - 35.3% ± 2.2%,实质图像为 - 13.3% ± 2.2%),三种病变的可检测性 (d′) 增加。从标准到清晰水平则发现了相反的模式。从平滑到清晰水平,
宠物分割算法在临床相关任务上的可靠性能是其临床翻译所必需的。然而,这些算法通常使用优异构件(FOM)进行评估,这些算法(FOM)未明确设计以与临床任务性能相关。这样的FOM包括骰子相似性系数(DSC),Jaccard相似性系数(JSC)和Hausdorff距离(HD)。这项研究的目的是研究使用这些任务无关FOM的PET策略算法是否会产生与临床相关定量任务的评估一致的插入。方法:我们进行了一项回顾性研究,以评估使用DSC,JSC和HD评估分割算法的一致性,并在估算非宠物宠物的主要小细胞癌症患者的原发性肿瘤的代谢性肿瘤体积(MTV)和总病变糖素分析(TLG)的任务上。PET图像是从美国放射学学院想象网络6668/放射疗法肿瘤学组0235多细胞临床试验数据中收集的。这项研究是在2种情况下进行的:(1)评估常规分割算法,即基于阈值的算法(SUV MAX 40%和SUV MAX 50%),边界检测(Snakes)和随机建模(Markov Random -Forner -Firfor -fland -fander -flost -Fird -Eld –Gaussian混合模型); (2)评估网络深度和损耗函数对基于最先进的U-NET的性能的影响 - 基于基于的分割算法。结果:基于DSC,JSC和HD的常规销售算法的评估表明,SUV最大40%的表现明显优于SUV最大50%。然而,SUV最大40%在估计MTV和TLG的任务上的准确性较低,在整体归一化偏置中分别增加了51%和54%。同样,马尔可夫随机场 - 高斯混合物模型在任务-Nostic FOM的基础上显着超过了蛇的表现,但在估计的MTV中产生了24%的偏差。对于基于U-NET的算法,我们的评估表明,尽管网络深度并未显着改变DSC,JSC和HD值,但较深的网络在估计的MTV和TLG中产生的较高的精度分别降低了91%和87%。此外,尽管不同损耗函数的DSC,JSC和HD值没有显着差异,但仍存在估计的MTV和TLG偏差差异73%和58%。结论:使用任务不合稳定FOM对PET分割算法的评估可能会产生不一致的发现
胸外按压是心肺复苏 (CPR) 期间促进全身循环的主要手段。最佳胸外按压可使心脏骤停患者获得良好的复苏效果。尽管最近的 CPR 指南建议使用实时反馈设备来在复苏期间维持高质量的 CPR,但它很少与良好的复苏效果相关[1-3]。原因之一可能是未监测胸外按压的位置。先前基于胸部计算机断层扫描的研究还发现,目前建议的胸外按压位置太高,无法有效压迫左心室 (LV) [4,5]。经食道超声心动图 (TEE) 被认为是一种很好的方法,可用于识别心脏骤停的可纠正原因以及监测 CPR 质量和位置[6-8]。它还可以在复苏期间不中断胸外按压的情况下识别受外胸按压的心脏结构[9]。因此,我们可以从心脏骤停患者 TEE 图像中评估胸外按压的准确位置和外部胸外按压产生的收缩功能。这可能验证 CPR 期间促进左心室收缩功能的最佳胸外按压方法[10-12]。分割左心室对于确定胸外按压的位置和获得心脏功能定量评估指标(如舒张末期容积、收缩末期容积、面积和射血分数)是必不可少的。人们进行了许多尝试来分割左心室。Noble 等[13]基于轮廓跟踪方法,采用了基于卡尔曼滤波器的心外膜和心内膜边界跟踪系统。Bosch 等[14]将边界检测的主动外观模型改进为主动外观运动模型,可实现全自动、强大且连续的左心室检测。大多数心脏图像,如超声波图像和核磁共振成像(MRI),都有模糊的边界和严重的噪声;因此,分析这些图像需要时间,而且结果可能因人而异。人工神经网络已被提出,因为它们提供了很高的分析精度,并使医学图像的泛化成为可能[15,16]。Smistad 等人[17]建议使用 U-Net [18] 的深度卷积神经网络进行 LV 分割模型,它由一个编码器-解码器组成,在生物医学图像中显示出鲁棒的分割模型。然而,U-Net 并没有考虑所有语义特征在解码过程中的贡献。因此,Moradi 等人[19]开发了一种改进的 U-Net,称为多特征金字塔 U-Net,其中通过在 U-Net 解码器路径的所有级别上链接特征图来补充特征。然而,现有的方法有一个局限性,即它们无法识别阴影和 LV 之间的模糊边界。此外,由于胸外按压,CPR 期间获取的 TEE 图像比正常超声心动图噪声更大。我们通过应用残差特征聚合方法和各种注意技术开发了基于 U-Net 的网络。我们的模型不仅展示了使用挤压和激励块以及残差块的强大特征提取技术,而且还关注更重要的特征。工作流程如图 1 所示。下一节描述了数据组织、深度学习的数据增强技术以及我们模型的结构。