引用本文: 于乃功, 谢秋生, 李洪政.基于点云处理的仿人机器人楼梯障碍物识别与剔除方法[J].北科大:工程科学学报 , 2025, 47(2): 339-350. doi: 10.13374/j.issn2095-9389.2024.05.10.001 YU Naigong, XIE Qiusheng, LI Hongzheng.Obstacle recognition and elimination method for humanoid robots based on point cloud processing[J].Chinese Journal of Engineering , 2025, 47(2): 339-350. doi: 10.13374/j.issn2095-9389.2024.05.10.001
自动驾驶汽车(SDVS)的抽象开发人员与可能的未来有一个特定的想法。公众不得分享其基于的假设。在本文中,我们分析了英国调查(N¼4,860)和美国(n¼1,890)公众的自由文本响应,这些公众询问受访者在想到SDV时会想到什么弹簧,以及为什么应该或不应该开发它们。响应(平均每个参与者的总共27个单词)倾向于提出安全的希望,并且更常规地担心。许多受访者都提出了技术,其他道路使用者与未来之间关系的替代书籍。而不是接受一种主导的公众参与方法,该方法试图使公众从这些观点中教育,而是建议这些观点应视为社会情报的来源,并为建立更好的运输系统做出了潜在的建设性贡献。预期治理,如果要包容,则应寻求理解和整合公众观点,而不是拒绝它们是不合理的或可变的。
Cheraghian 等人 [ 21 – 23 ] 在零样本 3 维模型分类方 面提出了 3 维点云的零样本学习方法、缓解 3 维零样 本学习中枢纽点问题的方法和基于直推式零样本学 习的 3 维点云分类方法,并将它们封装进一个全新 的零样本 3 维点云方法 [ 24 ] 中。以上方法均是利用已 知类样本的点云表征及其词向量对未知类别进行分 类,开创了零样本 3 维模型分类方法。近年来, CLIP 在零样本图像分类上取得了良好的效果,因此有研 究者将 CLIP 应用到零样本 3 维模型分类方法中, Zhang 等人 [ 25 ] 提出了基于 CLIP 的 3 维点云理解 (Point cloud understanding by CLIP, PointCLIP) 模型, PointCLIP 首先将 3 维点云投影成多个深度图,然 后利用 CLIP 的预训练图像编码器提取深度图特 征,同时将类别名称通过 CLIP 预先训练的文本编 码器提取文本特征。但是 PointCLIP 的性能受到深 度图和图像之间的域差异以及深度分布的多样性限 制。为了解决这一问题,基于图像 - 深度图预训练 CLIP 的点云分类方法 (transfer CLIP to Point cloud classification with image-depth pre-training, CLIP2Point) [ 26 ] 将跨模态学习与模态内学习相结合 训练了一个深度图编码器。在分类时,冻结 CLIP 的图像编码器,使用深度图编码器提取深度图特 征,该方法缓解了深度图和图像间的模型差异。用 于 3 维理解的图像 - 文本 - 点云一致性表征学习方法 (learning Unified representation of Language, Im- age and Point cloud for 3D understanding, ULIP) [ 27 ] 构建了一个图像、文本和点云 3 种模态的 统一嵌入空间,该方法利用大规模图像 - 文本对预 训练的视觉语言模型,并将 3 维点云编码器的特征 空间与预先对齐的视觉 - 文本特征空间对齐,大幅 提高了 3 维模型的识别能力。与之相似的是,基于 提示文本微调的 3 维识别方法 (CLIP Goes 3D, CG3D) [ 28 ] 同样使用 3 元组形式确保同一类别的 3 维模 型特征和图像特征之间以及 3 维模型特征和文本特 征之间存在相似性,从而使点云编码器获得零样本 识别的能力。另外, PointCLIP V2 [ 29 ] 在 Point- CLIP 的基础之上,通过利用更先进的投影算法和 更详细的 3 维模型描述,显着提高了零样本 3 维模型 分类准确率。本文采用语义增强 CLIP 解决图像和文 本的语义鸿沟问题,通过在语义层面为图像和文本 提供更多相似的语义信息,使图像和文本对齐更具有 一致性,从而有效提高 3 维模型的零样本分类性能。 2.2 提示工程
我们引入神经网络作为人工智能模型之一。神经网络是生物神经细胞回路中进行的信息处理的模型。神经细胞由称为细胞体的主体、从细胞体延伸出来的树突和连接到其他细胞的轴突组成。轴突的末端附着在其他神经细胞的树突上,轴突与其他神经细胞的连接处称为突触。树突接收来自其他细胞和感觉细胞的输入信号,信号在细胞体内进行处理,并通过轴突和突触将输出信号发送给其他神经元(图2(a))。 据称大脑中的神经元数量约为 10^10 到 10^11。通过结合这些细胞,每个神经元以并行和分布式的方式处理信息,从而产生非常复杂和先进的处理。一个细胞的输出通过突触传递到其他细胞,通过轴突可以分支成数十到数百个神经元。单个细胞具有的突触连接数量从数百个到数万个不等。所有这些突触连接都有助于神经元之间的信号传输。 当一个信号从另一个神经细胞到达一个神经细胞时,膜电位会因信号而发生变化,当信号超过一定的阈值时,电位就变为正值,神经细胞就会兴奋。然后它向其他神经元发送信号。无论输入值如何,该图的形状几乎都是相同的波形,一旦超过阈值,就会产生恒定形状和幅度的电脉冲。因此人们认为,神经网络中承载信息的不是电脉冲的波形,而是电脉冲的频率(图2(b))。 细胞体的阈值函数,当输入高于阈值时,发出电脉冲,当输入低于阈值时,不发出电脉冲,具有从输入到输出的非线性转换效果。此外,还有兴奋性突触,它会释放使输入神经细胞更容易兴奋的递质,还有抑制性突触,它会使输入神经细胞更不容易兴奋。接收输入神经元可以被认为是接收来自每个输出神经元的输入的总和。 神经网络的数学模型源于对神经元的观察。 1943年,McCullough和Pitts提出了正式的神经元模型。图 2(c)中的圆圈表示一个神经元的模型。 xk 取值 0 和 1,表示该神经元接收的突触数量。
摘要 - 点云注册是估计两个点云之间刚性转换矩阵的基本任务,并被视为下游视觉任务的先决条件。最近的工作试图使用可获得的RGB-D序列解决注册问题,而不是仅依靠点云,这可能并不总是可用。然而,由于多模式特征的简单串联和向量维度的增加,大多数现有的无监督RGB-D点云注册工作都难以获得细粒度,健壮,判别对应关系。这些方法通常遵循一个常见的范式:从输入数据中提取特征,估计对应关系并通过几何拟合获得转换矩阵。在这项工作中,我们设计了一个生成特征提取模块,以充分利用多模式信息,并寻求对通讯估计的新颖观点,该估算将源和目标点云中的点扩展到基于超矩形的嵌入中,并根据N-Dimensions space in-Dimensientions in-Dimensions in-Dimentions contractions in-Dimentimentions conteconsienss in-Dimentions contractions。每个基于高矩形的嵌入都是基于提出的生成特征提取模块的天然和歧视性语义的构建的,该模块涉及扩散分支,几何分支和点像素融合。我们利用生成模型的能力充分利用RGB-框架中的两种互补方式的信息。我们的代码将在以下网址发布:https://github.com/cbyan1003/dce。此外,这种独特的几何空间允许有效地计算交点量和模型概率概率,以估计对应关系。在3DMatch和扫描仪数据集上进行的广泛实验显示了该方法在这项具有挑战性的任务中的有效性,表现优于最先进的方法。
目标受众:国家制图机构,研究人员,学者,学生,私人公司的工作人员的先决条件:熟悉对遥感和测量的基本理解。对于具有计算机科学背景的人以及想要学习广泛基本原理的人(调查背景而不是编程),模块4和5中有单独的练习。课程目标:如今,使用大量不同的系统(例如手持式,背包,伪造型和范围内的无人机和无人机系统)获得了大量的移动和机载激光扫描点云。激光扫描已成为在非建造环境中提供3D周围环境的标准工具。本课程将了解如何将这种点云处理成信息学。对激光扫描物理和一般点云处理技术进行了简介,然后将更多的重点放在AI上,即在点云处理中的机器学习和深入学习方法。涵盖了几个应用程序。许多例子来自林业,激光扫描已经彻底改变了传统作品。解决的主题:在Espoo举行的当前研讨会上的演讲将提供介绍,以通过激光扫描广泛理解点云处理。这也将使那些不与计算机科学合作的人了解算法思维。将更详细的重点放在机器/深度学习 - 型对象检测上。
点云完成指的是从部分3D点云中完成3D形状是3D点云分析任务的基本问题。从深度神经网络的发展中受益,对点云完成的研究近年来取得了长足的进步。ever,如现有方法所涉及的明确局部区域分区使它们对点云的密度分布敏感。此外,它提供有限的接收场,可防止从远程上下文信息中捕获功能。为了解决问题,我们利用交叉注意和自我注意力的机制来设计新型的神经网络,以通过隐式局部区域分区完成点云完成。提出了两个基本单元的几何细节(GDP)和自我功能增强(SFA),以通过注意机制以简单而有效的方式直接建立点之间的结构关系。然后,基于GDP和SFA,我们构建了一个新框架,该框架使用流行的编码器架构进行点云组合。所提出的框架,即Pointattn,是模拟的,整洁而有效的,可以精确捕获3D形状的结构信息,并以详细的几何形状预测完整的点云。实验结果表明,我们的PointAttn在多个具有挑战性的基准上优于最先进的方法。代码可在以下网址找到:https://github.com/ohhhyeahhhh/pointattn
在这项研究中,使用了JETNET [21]数据集。每个数据集都包含Pythia [22]的射流,其能量约为1 TEV,每个射流包含多达30或150个成分(此处:30)。数据集在喷气发射的parton中。在这里,研究了顶级夸克,轻夸克和Gluon发射的喷气机的数据集[23,24]。每个数据集包含约170k个单独的喷气机分为110K / 10K / 50K用于培训 /测试 /验证,其中验证数据集用于我们的结果。射流成分,颗粒,用r = 0的圆锥半径聚类。8。这些颗粒被认为是无质量的,因此可以用它们的3-momenta或横向动量p t,伪t,伪质η和方位角角度描述。在JetNet数据集中,这些变量相对于喷气动量给出:ηrel Ibηi -ηi -η射流,ϕ rel i b ϕ i-(ϕ射流mod2π)和p rel t,i b p p t,i b p t,i / p t,i / p t,i / p t,jet,jet,i在喷气机中im ime im impoy im im ot a Jet中的粒子。计算这些相对数量的不变质量,例如,对于喷气质量,意味着m rel = m jet / p t,jet。Jetnet库[25]提供了本研究中使用的几个指标。此外,作者还提供了一个称为MPGAN [26]的基线模型。该数据集已在粒子物理社区中广受欢迎,作为基于PC的生成模型的基准[15-17,27-34]。
本作品根据 Creative Commons Attribution 4.0 许可协议授权。有关更多信息,请参阅 https://creativecommons.org/licenses/by/4.0/