扩散模型(DMS)已经实现了最新的(SOTA),从而导致LIDAR点云生成任务,从而受益于他们在抽样过程中稳定的训练和迭代精炼。但是,DMS由于其固有的降解过程而经常无法实际对LiDAR Raydrop噪声进行建模。为了保留迭代采样的强度,同时增强了射线噪声的产生,我们引入了Lidargrit,这是一种生成模型,该模型使用自动回应变压器在潜在空间而不是图像空间中迭代采样范围图像。此外,lidargrit还利用VQ-VAE分别解码范围和射线罩。我们的结果表明,与Kitti-360和Kitti Odometry数据集中的SOTA模型相比,Lidargrit的性能表现出色。代码可用:https://github.com/hamedhaghighi/lidargrit。
摘要:在自主驾驶技术不断发展的景观中,光检测和范围(LIDAR)传感器已成为增强环境感知的关键仪器。他们可以在车辆周围提供精确的,高分辨率的实时3D表示,以及在弱光条件下进行远程测量的能力。但是,这些优势是以传感器生成的大量数据为代价的,导致了传输,处理和存储操作的几个挑战,目前可以通过对点云中使用数据压缩技术来减轻这些挑战。本文介绍了用于压缩汽车LIDAR传感器的点云数据的现有方法的调查。它提出了一种全面的分类法,将这些方法分为四个主要群体,并在几个重要指标中进行比较和讨论。
摘要:建筑信息建模(BIM)的结合带来了土木工程的重大进步,增强了项目生命周期的效率和可持续性。激光扫描等高级3D点云技术的利用扩展了BIM的应用,尤其是在操作和维护中,促使探索自动化解决方案以进行劳动密集型点云建模。本文介绍了监督机器学习(特别是支持向量机)的演示,用于分析和分割3D点云,这是3D建模的关键步骤。对点云语义分割工作流进行了广泛的审查,以涵盖关键元素,例如邻域选择,特征提取和特征选择,从而为此过程开发了优化的方法。在每个阶段都实施各种策略,以增强整体工作流程并确保弹性结果。然后使用来自桥梁基础结构场景的不同数据集评估该方法,并将其与最先进的深度学习模型进行了比较。调查结果强调了在精确细分3D点云时监督机器学习技术的有效性,超过了较小的培训数据集的深度学习模型,例如PointNet和PointNet ++。通过实施高级分割技术,要点对点云的3D建模所需的时间有所减少,从而进一步提高了BIM过程的效率和有效性。
随着人工智能技术发展的繁荣,大型语言模型正在展示其在理解和创造力方面的潜力。大型语言模型(例如GPT-4和Gemini)能够有力地学习各种专业级考试。但是,作为语言模型本身,其强大的理解只能反映在文本序列中。当前,尽管可以通过3D点云与大型语言模型之间的连接生成视频,但目前尚无提示项目通过属性计算结果直接与一维相互作用。点云数据也丰富了可以支持城市建设的各种任务的信息。对于场景级别的点云数据,已经进行了许多有关语义细分,目标检测和其他任务的研究。但是,通常很难从感知结果中为场景构建提供直接帮助。本文通过结合3D点云语义细分的结果,介绍了一种将大语言模型应用于城市生态结构的方法。目的是将大语言模型(LLM)(LLM)的先验知识和创造能力集成到城市发展中,并将结果与点云语义分段结果得出。这种整合旨在建立一个互动点云智能分析系统,该系统是为了帮助城市生态文明建设中的决策过程而定制的,从而为智能城市发展的发展提供了创新的观点。
摘要 - 视觉控制策略在视觉条件(如照明或摄像机位置)与训练过程中所见的情况有所不同时可能会遇到重大的性能降解 - 通常甚至在较小的差异方面表现出急剧下降的能力。在这项工作中,我们研究了基于RGB-D和基于点云的视觉控制策略的这些类型的视觉变化的鲁棒性。要对基于模型和基于模型的强化学习者进行这些实验,我们引入了一种新颖的Point Cloud World Model(PCWM)和基于点云的控制策略。我们的实验表明,明确编码点云的策略比其RGB-D对应物更强大。此外,我们发现我们提出的PCWM在训练过程中的样本效率方面显着优于先前的工作。在一起,这些结果表明,通过点云进行有关3D场景的推理可以提高性能,减少学习时间并增加机器人学习者的鲁棒性。项目网页:https://pvskand.github.io/projects/pcwm
正如建筑师向学生解释的那样,Jean-LouisChanéac于1963年探索了塑料“蜂窝寄生虫”的设计,并在1968年的“叛乱建筑宣言”中概述了。 Chanéac提议使用此类细胞将其作为代表的无政府状态解决方案,以实现住房需求和现代主义Archi讲述的压迫性单调。牢房将填充整个住房块,并用自主,可连接的房间扩展单个单元。宣言在讲法语的建筑世界的某个教派中被广泛阅读,1970年,一位名叫Marcel Lachat的建筑师在他在日内瓦的公寓的外墙上建造了一个牢房,将其配音为“ Bulle Pirate” - Pirate Bubble。这是拉查特(Lachat)的海盗泡沫投射到教室墙上的图像。
摘要:铁路场景的理解对于各种应用程序至关重要,包括自主火车,数字缠绕和基础设施变更监控。但是,后者的开发受到现有算法缺乏注释的数据集和局限性的限制。为了应对这一挑战,我们提出了铁路3D,这是铁路环境中语义细分的第一个综合数据集,并进行了比较分析。Rail3D涵盖了来自匈牙利,法国和比利时的三种不同的铁路环境,捕获了各种各样的铁路资产和条件。有超过2.88亿个注释点,Rail3D超过了大小和多样性的现有数据集,从而可以训练可概括的机器学习模型。我们进行了一个通用的分类,该分类使用了九个通用类(地面,植被,铁路,电线,信号,围栏,安装和建筑物),并评估了三种最先进模型的性能:KPCONV(内核点卷积),LightGBM和随机森林。最佳性能模型,一种经过的kPCONV,在联合(MIOU)上达到了平均值为86%。基于LightGBM的方法获得了71%的MIOU,但表现优于随机森林。这项研究将通过为3D语义细分提供全面的数据集和基准,从而使基础设施专家和铁路研究人员受益。数据和代码可公开用于法国和匈牙利,并根据用户反馈进行连续更新。
3D场景图预测的当前方法依赖于标记的数据集来训练固定的对象类和关系类别的固定模型。我们提供Open3DSG,这是一种在开放世界中学习3D场景图预测的替代方法,而无需标记的场景图数据。我们将3D场景图预测主链的功能与功能性开放世界2D Vision Language Foundation Models的功能空间相结合。这使我们能够通过从开放的词汇查询对象类,并以零摄像的方式从3D点云中预测3D场景图,并从接地的LLM中预测与场景图fea的接地LLM相对的关系,并查询对象类作为上下文。Open3DSG是第一个3D点云方法,不仅可以预测显式开放式唱机对象类,而且还可以预测不限于预定标签集的开放式关系 - 使得在预测的3D场景图中表达稀有物以及特定的对象和关系。我们的实验表明,Open3DSG可以有效地预测Arbitary对象类别及其复杂的对象间关系,描述了空间,支持性,语义和比较关系。
摘要:为了指导果园管理机器人实现果园生产中的某些任务,例如自主导航和精确喷涂,这项研究提出了一个深入学习的网络,称为动态融合细分网络(DFSNET)。该网络包含局部特征聚合(LFA)层和动态融合分割体系结构。LFA层使用位置编码器进行初始转换嵌入,并通过多阶段层次结构逐渐汇总本地模式。Fusion分割模块(FUS-SEG)可以通过学习多插入空间来格式化点标签,而生成的标签可以进一步挖掘点云特征。在实验阶段,在果园田的数据集中证明了DFSNET的显着分割结果,其准确率为89.43%,MIOU率为74.05%。dfsnet优于其他语义细分网络,例如PointNet,PointNet ++,D-PointNet ++,DGCNN和Point-NN,其精度的提高了11.73%,3.76%,3.76%,2.36%,2.36%和2.74%,并分别为2.74%,并改善了这些网络,并改善了这些网络,并分别为28.3%,28.3%,9.9%,9.9%,9.9%,9.9%,9.9%,9.9%,占28.3%,占28.3%,占28.3%,分别为9.19%,分别为9.9%,均为28.3%,分别为9.3%,分别为2.19%。在全尺度数据集(简单尺度数据集 +复杂尺度数据集)上,分别为9.89和24.69%。提议的DFSNET可以从果园场景点云中捕获更多信息,并提供更准确的点云分割结果,这对果园的管理有益。
抽象的物镜经硫代蛋白淀粉样蛋白心肌病(ATTR-CM)是由沉积野生型或突变的转染素引起的浸润性心脏疾病。作为特性疾病,我们试图确定其特发性高度心房(AV)块的患者的患病率,需要永久性起搏器(PPM)。在2019年11月至2021年11月之间,经过PPM植入PPM的70-85岁的连续患者提供了3,3-二磷酸-1,2-二磷酸-1,2-丙二烷二键二羧酸(DPD)扫描。人口统计学,合并症,心电图和成像数据。结果39例患者(男性为79.5%,设备植入76.2(2.9)年)进行了DPD扫描。3/39(7.7%,全男性)的结果与属性(佩鲁吉尼2或3级)一致。平均DPD扫描的人的最大壁厚为19.0 mm(3.6毫米),而阴性扫描的患者为11.4 mm(2.7 mm)(p = 0.06)。所有被诊断为ATTR-CM的患者患有脊柱狭窄,两名患有腕管综合征。结论应在需要永久起搏的老年患者中考虑高度AV块,尤其是在存在左心室肥大,腕管综合征或脊柱狭窄的情况下。