摘要 - 近年来,人们对在轨道内运营(例如更新,停靠和接近操作)的自主权的需求不断增长,从而导致人们对采用深度学习的飞船姿势估计技术产生了兴趣。但是,由于对实际目标数据集的访问有限,算法通常是使用合成数据训练并应用于真实域中的,因此由于域间隙而导致性能下降。最新方法采用域适应技术来减轻此问题。在搜索可行解决方案中,过去探索了事件感应,并显示出可减少模拟和现实世界情景之间的域间隙。事件传感器近年来在硬件和软件方面取得了重大进步。此外,与RGB传感器相比,事件传感器的特性在空间应用中具有多个优势。为了促进基于DL的模型的进一步培训和评估,我们介绍了一个新的数据集,包括在受控的实验室环境中获得的真实事件数据,并使用相同的摄像机内在系统模拟了事件数据。fur-hoverore,我们引入了一个基于图像的事件表示形式,该表示的性能优于现有表示形式。此外,我们提出了一种有效的数据过滤方法,以提高培训数据的质量,从而提高模型性能。使用不同的事件表示,事件过滤策略和算法框架进行了多方面的基线评估,并总结了结果。数据集将在http://cvi2.uni.lu/spades上提供。
我们提出了D置位(D EPTH作为3D人类PO SE和S HAPE E刺激的中间代码),这是一种单阶段方法,可估计来自单个RGB图像的人姿势和Smpl-X形状参数。最近的作品将较大的模型与变压器骨架和解码器一起提高人体姿势和形状(HPS)基准的准确性。d-pose提出了一种基于视觉的ap-porach,它使用估计的人类深度映射作为HPS和利用合成数据的培训的中间表示,并在训练过程中提供了与它们一起提供的地面深度映射。尽管在合成数据集中受过培训,但D-Pose在现实世界基准数据集,EMDB和3DPW上实现了最新的性能。尽管其简单的轻巧设计和CNN主链,但它的表现优于基于VIT的模型,这些模型的模型几乎较大。d-pose代码可用:https://github.com/nvasilik/d-pose
现在,自主系统的增加要求这些系统能够在其环境中与其他物体近距离工作,并且需要在环境物体上完成许多任务,例如装配、运输、会合、对接或避开它们,如碰撞检测/避免、路径规划等。在这篇文献综述中,我们讨论了基于机器学习的算法,这些算法解决了基于视觉的自主系统的第一步,即基于视觉的姿势估计。本文对使用 2D 和 3D 输入数据的 6D 姿势估计的进展进行了批判性回顾,并比较了它们如何应对基于计算机视觉的定位问题所面临的挑战。我们还研究了算法及其在太空任务中的应用,如在轨对接、会合和空间视觉应用带来的挑战。在综述的最后,我们还强调了一些小问题和未来研究的可能途径。
摘要。2016 年,风能占美国所有发电量的 5.6%。大部分发展发生在农村地区,那里有利于利用风能的开放空间也为通用航空机场提供服务。因此,美国近 40% 的风力涡轮机都位于小型机场 10 公里范围内。风力涡轮机通过从大气中提取动量来发电,产生以风速不足和湍流增加为特征的顺风尾流。最近,涡轮机尾流对小型飞机构成危险的担忧已被用来限制风电场的发展。在此,我们使用公用事业规模涡轮机尾流的大涡模拟 (LES) 评估小型飞机的滚动危险。计算假设飞机以各种方向横穿尾流时风产生的升力和随后的滚转力矩。探讨了稳定和中性分层的情况,稳定情况代表了可能的最坏情况,因为较低的环境湍流允许更长时间的尾流持续。在这两种情况下,假设飞机在下行尾流和横行尾流横穿过程中经历的滚转力矩中只有 0.001% 会导致滚转风险增加。
在太空着陆操作期间,准确估计航天器的相对姿态对于确保安全成功着陆至关重要。本文提出了一种基于 3D 光检测和测距 (LiDAR) 的 AI 相对导航架构解决方案,用于自主太空着陆。所提出的架构基于混合深度循环卷积神经网络 (DR-CNN),将卷积神经网络 (CNN) 与基于长短期记忆 (LSTM) 网络的循环神经网络 (RNN) 相结合。获取的 3D LiDAR 数据被转换为多投影图像,并将深度和其他多投影图像输入 DRCNN。该架构的 CNN 模块可以有效地表示特征,而 RNN 模块作为 LSTM,可提供鲁棒的导航运动估计。我们考虑、模拟和实验了各种着陆场景,以评估所提出架构的效率。首先使用 PANGU(行星和小行星自然场景生成实用程序)软件创建基于 LiDAR 的图像数据(范围、坡度和海拔),然后使用这些数据对所提出的解决方案进行评估。建议使用 Gazebo 软件中的仪表化空中机器人进行测试,以模拟在合成但具有代表性的月球地形(3D 数字高程模型)上着陆的场景。最后,使用配备 Velodyne VLP16 3D LiDAR 传感器的真实飞行无人机进行真实实验,以在设计的缩小版月球着陆表面上着陆时生成真实的 3D 场景点云。所有获得的测试结果表明,所提出的架构能够通过良好合理的计算提供良好的 6 自由度 (DoF) 姿势精度。
我们介绍了CGAPOSENET+GCAN,它通过使用几何Clifford代数网络(GCAN)增强了CGAPOSENET,这是相机姿势回归的架构。添加GCAN,我们仅从RGB图像中获得了相机姿势回归的几何感知管道。cgaposenet使用Clifford几何代数将四元组和翻译向量统一为单个数学对象,即电动机,可用于独特地描述相机姿势。cgaposenet可以在其他方法中获得综合结果,而无需调查损失功能或有关场景的其他信息,例如3D点云,这可能并不总是可用。cgaposenet就像文献中的几种方法一样,只学会了预测运动系数,并且没有意识到预测位于其几何含义的数学空间。通过利用几何深度学习的最新进展,我们从GCAN上修改了CGAPOSENET:从InceptionV3背骨中获得与摄像机框架相关的可能的运动系数的建议,然后通过在G 4,0中使用的一组层来,将它们通过单个电动机为单个电动机。网络的工作是几何意识,具有多活性价值in-
在这项工作中,我们提出了一种用于人形 iCub 机器人头部姿势估计和场景表示的神经形态架构。脉冲神经网络在英特尔的神经形态研究芯片 Loihi 中完全实现,并精确整合发出的运动命令,以在神经路径整合过程中估计 iCub 的头部姿势。iCub 的神经形态视觉系统用于校正姿势估计中的漂移。机器人前方物体的位置使用片上突触可塑性来记忆。我们使用机器人头部的 2 个自由度 (DoF) 进行实时机器人实验,并展示精确的路径整合、视觉重置和片上物体位置学习。我们讨论了将机器人系统和神经形态硬件与当前技术集成的要求。
最近,时空变压器结构已被广泛应用于3D人类姿势估计的问题,从而实现了最新的性能。这些方法中的许多方法都将单个框架中的单个关节视为令牌,并且在同一框架或相同轨迹的令牌上施加注意力。尽管这种结构可有效地计算单个关节之间的相关性,但它过于限制,因为诸如帧或轨迹之类的全局特征无法很好地传达。在本文中,我们建议Galformer解决此问题。Galformer由局部和全局变压器块组成,前者基于关节令牌,如先前的方法一样,而后者,即全局混合变压器,将所有关节混合在特定框架范围内的所有关节,以实施特征交换的电感偏见。在提出的方法中交替重复这两个变压器块,以计算关节,形状和轨迹之间的相关性。实验表明,与人类36M,MPI-INF-3DHP和HUMANEVA数据集的现有方法相比,我们的方法具有优越或至少具有竞争性能。
fi g u r e 3初始(前胸甲)在MGCO 2 E HA -1(a)中的地上森林碳密度和森林碳的平均百分比在飓风(DFC/AFC*100)之后立即降低(dfc/afc*100),这三种情况下,新英格兰县总结了三种情况(b)。地上森林碳(AFC)的值代表了我们八个硬木和软木水池中存储的碳(表2),深绿色的阴影代表了高森林碳密度和浅绿色阴影,代表低森林碳。较深的红色和橙色代表较高的森林碳(DFC)的较高部分,黄色阴影较轻,代表较低的DFC百分比,白色代表零DFC。另外,图S2显示了MMTCO 2 e中新英格兰县的累积AFC和DFC值。地图线描述了研究区域,不一定描绘了公认的国家边界。
I.简介基于v iSion的导航是下一代On-On-On-On-On-On-Os-andActivedEbrisredebremoval任务的关键技术。在这些情况下,指导和控制定律应采用相对的Chaser-Chaser-Toget姿势(即位置和态度)喂食,这可能会从单眼图像中方便地估算,因为这些传感器是简单,光线的,并且消耗了很少的功率。传统上,图像处理算法分为1)手工制作的特征[1,2]和2)基于深度学习的[3-14]。然而,前者受到较低鲁棒性的影响,对典型的空间图像特征(例如,信噪比低,严重和迅速变化的照明条件)和背景。神经网络(NNS)可以通过适当的培训克服此类弱点,但通常会导致高计算负担,这与典型的船上处理能力几乎不兼容。