从单个视图中恢复3D场景几何形状是计算机视觉中的基本问题。虽然经典的深度估计方法仅推断出2.5D场景表示为图像平面,但最新的基于辐射范围的aperach是重建完整的3D代表。然而,这些方法仍然在被占地的区域困难,因为没有视觉观察的几何形状需要(i)周围的语义知识,以及(ii)关于空间上下文的推理。我们提出了Kyn,这是一种单视场景重建的新方法,其原因是语义和空间上下文来预测每个点的密度。我们引入了一个视觉模块模块,以使用细粒度的语义信息丰富点特征。我们通过语言引导的空间注意机制在整个场景中汇总了点表示,以产生意识到3D语义环境的每点密度预测。我们表明,与预测每个3D点的密度相比,Kyn改善了3D形状的恢复。我们在Kitti-360上实现了最新的场景和对象重建结果,并且与先前的工作相比,零弹性概括的改进。项目页面:https://ruili3.github.io/kyn。
采用多目标遗传算法 (MOGA) 优化方法,对具有五个电极和两个目标函数的静电电子光学系统的设计进行了优化。考虑的两个目标函数是固定图像平面中一次电子束的最小探针尺寸和镜头内探测器平面上的最大二次电子检测效率。耗时的步骤是计算系统电位。有两种方法可以做到这一点。第一种是使用 COMSOL(有限元法),第二种是使用二阶电极法 (SOEM)。前者使优化过程非常缓慢但准确,而后者使其快速但准确性较低。提出了一种全自动优化策略,其中基于 SOEM 的 MOGA 为基于 COMSOL 的 MOGA 提供输入系统。这加速了优化过程并将优化时间缩短了至少约 10 倍,从几天缩短到几个小时。典型的优化系统的探针尺寸为 11.9 nm,二次电子检测效率为 80%。这种新方法可以在具有一个或多个目标函数和多个自由变量的静电透镜设计中实现,是一种非常高效、全自动的优化技术。
如今,民用飞机借助外部技术实现自动着陆。最常用的系统称为 ILS(仪表着陆系统),它允许飞机在无需飞行员操作(监控除外)的情况下着陆。其他定位解决方案包括差分 GPS、IRS(惯性参考系统)或 VOR/DME(甚高频全向测距/距离测量设备)。这些技术并非随处可用(未配备或未知的机场)且并非随时可用(存在故障概率)。为了应对这些问题(获得精确的绝对位置)并扩大自动着陆覆盖范围,将研究使用摄像机作为附加信息源。在过去十年中,摄像机技术取得了技术飞跃,因此为每架飞机配备摄像机似乎既简单又便宜。视觉伺服包括使用视觉传感器和计算机视觉算法来控制系统的运动(参见 [1] 中的教程)。第一类控制称为 PBVS(基于姿势的视觉伺服),包括使用视觉测量来估计相机的偏差或方向。第二类控制称为 IBVS(基于图像的视觉伺服),包括控制图像平面中视觉特征的坐标。过去十年来,人们一直在研究用于飞机自动着陆的 IBVS 解决方案;在 [2][3][4][5][6] 中,提出了制导解决方案,以达到并跟踪所需的进近轨迹。尽管如此,这些方案需要开发具有完整链的新制导律(由图像捕获、图像处理和非线性制导算法组成),这可能难以认证
准确的人类轨迹预测对于诸如Au sostos evers,机器人技术和监视系统等应用至关重要。然而,现有模型通常无法完全利用非语言社会提示在浏览空间时潜意识的人类信息。为了解决这个问题,我们介绍了社会转变,这是一个基于通用变压器的模型,利用多样化和众多的视觉提示来预测人类行为。我们将提示的想法从自然语言处理(NLP)转化为人类轨迹预测的任务,其中提示可以是地面上的X-y坐标序列,图像平面中的边界框或2d或3d中的身体姿势关键点。这又增加了轨迹数据,从而导致人类轨迹预测增强。使用掩蔽技术,我们的模型通过基于可用的视觉提示捕获代理之间的空间相互作用来表现灵活性和适应性。我们深入研究了使用2D与3D姿势的优点,以及一组有限的姿势。另外,我们研究了空间和时间注意图,以确定序列中哪些关键点和时间步骤对于优化人类轨迹预测至关重要。我们的方法在多个数据集上得到了验证,包括JTA,JRDB,行人和骑自行车的人在道路交通和Eth-Cucy中进行验证。该代码公开可用:https://github.com/vita-epfl/social-transmotion。
初步沟通 基于人工智能的车载自动列车障碍物距离估计 Ivan ĆIRIĆ*、Milan PAVLOVIĆ、Milan BANIĆ、Miloš SIMONOVIĆ、Vlastimir NIKOLIĆ 摘要:本文提出了一种新方法,利用图像平面单应性矩阵来改进对摄像机和成像物体之间距离的估计。该方法利用两个平面(图像平面和铁轨平面)之间的单应性矩阵和一个人工神经网络,可根据收集的实验数据减少估计误差。SMART 多传感器车载障碍物检测系统有 3 个视觉传感器——一个 RGB 摄像机、一个热成像摄像机和一个夜视摄像机,以实现更高的可靠性和稳健性。虽然本文提出的方法适用于每个视觉传感器,但所提出的方法是在热成像摄像机和能见度受损场景下进行测试的。估计距离的验证是根据从摄像机支架到实验中涉及的物体(人)的实际测量距离进行的。距离估计的最大误差为 2%,并且所提出的 AI 系统可以在能见度受损的情况下提供可靠的距离估计。 关键词:人工神经网络;自动列车运行;距离估计;单应性;图像处理;机器视觉 1 简介 通过遵循自动化趋势,可以大大提高铁路货运的质量和成本竞争力,以实现经济高效、灵活和有吸引力的服务。今天,自动化和自主操作已经在公路、航空和海运中变得普遍。现代港口拥有自动导引车 (AGV),可将集装箱从起重机运送到轨道旁、仓库、配送中心,而自动驾驶仪是航空公司和大型货船的标准配置,不需要大量机上人员。自动驾驶汽车和卡车的发展已经进入了一个严肃的阶段。此外,轨道交通自主系统的发展主要出现在公共交通服务领域(无人驾驶地铁线路、轻轨交通 (LRT)、旅客捷运系统和自动引导交通 (AGT))。基本思想是使用一定程度的自动化,将操作任务从驾驶员转移到列车控制系统(例如 ERTMS)。根据国际电工委员会 (IEC) 标准 62290-1,列车自主运行 (ATO) 是高度自动化系统的一部分,减少了驾驶员的监督 [1]。对于完全自主的列车运行,列车操作员的所有活动和职责都需要由多个系统接管,这些系统可以感知环境并俯瞰现场,检测列车路径上的潜在危险物体并做出相应的正确反应 [2-6]。障碍物检测系统作为 ATO 系统的主要部分,障碍物检测系统需要根据货运特定和一般用例(例如 EN62267 和/或自动化领域的相关项目)来监控环境。为了满足严格的铁路标准和法规,障碍物检测系统 (ODS) 应在具有挑战性的环境和恶劣的能见度条件下工作。ODS 是一种具有硬件和软件解决方案的机器视觉系统(图 1),用于提供有关铁路上和/或其附近障碍物的可靠信息,并估算从系统到检测到的障碍物的距离 [7]。该系统需要实时运行,并在不同的光照条件下运行(白天、
自主驾驶(AD)技术的快速进步显着强调了准确可靠的感知系统的发展,尤其是对于3D对象检测。本论文的重点是通过利用激光摄像机融合来增强自主驾驶中的3D对象。主要目的是开发一个可靠的系统,该系统将激光雷达的精确距离测量能力与相机信息提供的丰富上下文信息集成在一起,从而提高在多样化和动态驱动环境中对象检测的准确性和可靠性。本研究的目标包括开发传感器融合的系统,实施深度学习模型来处理融合数据以及通过实验验证所提出的方法。采用了预训练的Yolov5模型来检测相机捕获的2D图像中的对象。然后使用LiDAR数据将检测到的对象投影到3D空间中,该数据已同步并与相机数据校准。融合过程涉及将LIDAR点云转换为2D图像平面,以将深度信息与检测到的对象相关联,从而促进准确的3D对象。结果表明,整合LiDAR和相机数据可改善3D对象检测的效果。评估过程,其中包括将估计深度与实际测量结果进行比较,显示出最小的差异,从而证明了系统的高准确性和可靠性。本文通过在3D对象检测中提供了经过验证的IMELAIMEN-IMELAIMENT系统,从而有助于自动驾驶的领域。这些发现强调了传感器融合在增强自动驾驶汽车中感知系统的鲁棒性和准确性方面的重要性。未来的工作可能会集中在不利的天气条件下改善系统的绩效,集成其他传感器,例如雷达等其他传感器,并探索更先进的深度学习模型,以进一步推动自主驾驶技术的capabilies。
摘要。微机电系统 (MEMS) 可变形镜 (DM) 可通过小型、低功耗设备提供高精度波前控制。这使得它们成为未来太空望远镜的关键技术选择,这些望远镜需要自适应光学系统,以便使用日冕仪对系外行星进行高对比度成像。可变形镜演示任务 (DeMi) CubeSat 有效载荷是一种微型太空望远镜,旨在首次在太空中展示 MEMS DM 技术。DeMi 有效载荷包含一个 50 毫米主镜、一个内部校准激光源、一个来自波士顿微机械公司的 140 个执行器 MEMS DM、一个图像平面波前传感器和一个 Shack - Hartmann 波前传感器 (SHWFS)。DeMi 有效载荷的关键要求是测量单个执行器波前位移贡献,精度为 12 nm,并将空间中的静态和动态波前误差校正到小于 100 nm RMS 误差。 DeMi 任务将把 MEMS DM 技术的技术就绪水平从五级提升到至少七级,以适应未来的太空望远镜应用。我们总结了 DeMi 光学有效载荷的设计、校准、光学衍射模型、对准、集成、环境测试和来自空间操作的初步数据。地面测试数据表明,DeMi SHWFS 可以测量 MEMS DM 上的各个执行器偏转,误差在干涉校准测量值的 10 nm 以内,并且可以满足 0 到 120 V 之间执行器偏转电压 12 nm 精度任务要求。整个环境测试中的有效载荷数据表明,MEMS DM 和 DeMi 有效载荷经受住了环境测试,并为与空间数据进行比较提供了宝贵的基线。来自空间操作的初始数据显示,MEMS DM 在空间中驱动,来自空间的各个执行器测量值与等效地面测试数据之间的平均一致性为 12 nm。© 作者。由 SPIE 根据知识共享署名 4.0 未移植许可证发布。分发或复制本作品的全部或部分内容需要注明原始出版物的归属,包括其 DOI。[DOI:10.1117/1.JATIS.7.2.024002]