摘要 - 卷积神经网络(CNN)可成功地用于重要的汽车视觉感知任务,包括对象识别,运动和深度估计,视觉猛击等。但是,这些任务通常是独立探索和建模的。在本文中,我们提出了一个联合多任务网络设计,用于同时学习多个任务。我们的主要动机是通过在所有任务之间共享昂贵的初始卷积层来实现的计算效率。的确,自动驾驶系统中的主要瓶颈是部署硬件可用的有限处理能力。也有一些证据表明,在提高某些任务和缓解发展工作的准确性方面还有其他好处。它还提供了可扩展性,以添加更多的任务利用现有功能并实现更好的概括。我们调查了自动驾驶中视觉感知任务的各种基于CNN的解决方案。然后,我们为重要任务提出了一个统一的CNN模型,并讨论了一些高级优化和体系结构设计技术以改善基线模型。本文是部分审查的,部分是位置,并证明了几个初步结果可用于未来的研究。我们首先展示了多流学习和辅助学习的结果,这些学习是扩展到大型多任务模型的重要成分。最后,我们实现了一个两条三任务网络,该网络在许多情况下与相应的单件任务模型相比,在许多情况下的性能更好,同时保持网络尺寸。
基于标记数据的抽象深度学习在计算机视觉,语音识别和自然语言处理方面取得了巨大成功。与未标记的数据相比,标记的数据只是海洋中的下降。人们如何有效地利用未标记的数据?研究重点是无监督和半监督的学习来解决此类问题。一些理论和经验研究证明,未标记的数据可以帮助提高对抗性攻击下的概括能力和鲁棒性。但是,关于鲁棒性和未标记数据之间关系的理论研究将其范围限制为玩具数据集。同时,自主驾驶中的视觉模型需要稳健性的良好改善,以确保安全性和安全性。本文提出了一个半监督的学习框架,用于自动驾驶汽车中的对象检测,从而通过未标记的数据提高了鲁棒性。首先,我们建立了一个基线,并通过学习无监督的对比学习方法-Momentum对比度(MOCO)。其次,我们提出了一种半监督的共同训练方法,以标记未标记的数据以进行重新培训,从而改善了对自主驾驶数据集的概括。第三,我们基于搜索算法使用的无监督边界框数据扩展(BBAG)方法,该方法使用增强构层学习来改善对象检测的鲁棒性来进行自动驾驶。我们介绍了一项关于Kitti数据集的实证研究,该数据集采用了多样化的讽刺攻击方法。我们提出的方法在白色框攻击(DPATCH和上下文补丁)和黑盒攻击(高斯噪音,雨水,雾,雾等)下实现了最新的概括和鲁棒性。我们提出的方法和经验研究表明,使用更未标记的数据有益于自主驾驶中感知系统的鲁棒性。
摘要 - 评估和培训自主驾驶系统需要多样化且可扩展的角案例。但是,大多数现有场景生成方法都缺乏可控性,准确性和多功能性,从而导致产生不令人满意的结果。受图像生成中Draggan的启发,我们提出了DragTraffic,这是基于条件扩散的广义,交互式和可控制的交通场景生成框架。dragtraffic使非专家可以通过自适应混合物专家体系结构为不同类型的交通代理生成各种逼真的驾驶场景。我们采用回归模型来基于条件扩散模型提供一般的初始解决方案和改进程序,以确保多样性。通过交叉注意来引入用户注定的上下文,以确保高可控性。在现实世界中的数据集上进行的实验表明,拖拉法在真实性,多样性和自由方面优于现有方法。演示视频和代码可在https://chantss.github.io/dragtraffic/上找到。
摘要 - 肌形加密(HE)是用于构建隐私应用程序的常用工具。但是,在许多客户和高延迟网络的情况下,由于密码大小较大而引起的通信成本是bot-tleneck。在本文中,我们提出了一种新的压缩技术,该技术使用具有较小的密文的添加剂同构加密方案,以基于错误的学习(LWE)来压缩大型同构密文。我们的技术利用了此类密文的解密中的线性步骤,以将部分解密委托给服务器。我们达到的压缩比最高90%,这仅需要一个小的压缩密钥。通过同时压缩多个密文,我们的压缩率超过99%。我们的压缩技术可以很容易地应用于将LWE密文从服务器传输到客户端的应用程序,以作为对查询的响应。更重要的是,我们将技术应用于私人信息检索(PIR),其中客户端访问数据库而无需透露其查询。使用我们的压缩技术,我们提出了Zippir,这是一种PIR协议,它在文献中所有协议中达到了最低的总体通信成本。Zippir不需要在预处理阶段与客户进行任何通信,这是用于与短暂客户端或高延迟网络的PIR用例的绝佳解决方案。
摘要。现有的3D语义占用预测方法典型地将任务视为一个单发的3D体素分割问题,在输入和占用图之间的单步映射上进行了限制,这限制了它们完善和完成本地区域的能力。在本文中,我们引入了Occgen,这是3D语义占用预测的简单而强大的生成感知模型。Occgen采用了“噪声到占用”生成范式,通过预测和消除随机高斯分布来逐渐推断和完善占用图。OCCGEN由两个主要组成部分组成:一个能够处理多模式输入的条件编码器,以及一种采用多模式特征作为条件的逐步改进解码器。对这种生成管道的关键见解是,扩散的deoising过程自然能够对密集的3D杯映射的粗到细化进行建模,从而产生更详细的预测。对几个占用基准的广泛实验证明了与最新方法相比,该方法的有效实验。例如,OCCGEN在Muli-Modal,仅LIDAR-仅和仅相机设置下的Nuscenes-cupancy数据集中相对将MIOU提高9.5%,6.3%和13.3%。此外,作为一种生成感知模型,Occgen表现出鉴别模型无法实现的理想特性,例如在其多步预测并提供不确定性估计的情况下。
摘要 - 基于端到端视力的模仿学习已直接从专家演示中学习控制命令来证明自主驾驶的有希望的结果。然而,传统方法依赖于基于回归的模型,这些模型提供了精确的控制,但缺乏一致性估计或基于分类的模型,这些模型提供了置信度得分,但由于分离而降低了精度。此限制使量化预测行动的可靠性并在必要时应用更正是一项挑战。在这项工作中,我们引入了双头神经网络体系结构,该架构既集成回归和分类负责人,以提高模仿学习中的决策可靠性。回归负责人预测了连续的驾驶动作,而分类头则估计了置信度,从而实现了一种调整机制,该校正机制可以调整低信心情景中的动作,从而增强了驾驶稳定性。我们在Carla模拟器内的闭环环境中评估了我们的方法,证明了其检测不确定的动作,估计信心并应用实时校正的能力。实验结果表明,我们的方法可降低车道偏差,并提高了传统精度高达50%,表现优于常规回归模型。这些发现突出了分类指导置信度估计的潜力,以增强基于视觉的模仿学习对自主驾驶的鲁棒性。源代码可在https:// github上找到。com/elahedlv/profester_aware_il。
来自图像的深度估计是具有广泛应用的计算机视觉中的一个长期问题。对于基于视觉的自动驾驶系统,感知深度是理解道路对象和建模3D环境图的相关性的不可或缺的模块。由于深度神经网络用于求解各种视觉概率,因此基于CNN的方法[2-5,13,39 - 42,44,44,46,48,52]主导了各种深度基准。根据输入格式,它们主要将其分为多视图深度估计[3,13,23,26,44,45,51,53]和单视深度估计[14 - 16,19,37,38]。多视图方法估计深度的假设,即给定的深度,相机校准和摄像头姿势,这些像素应相似。他们依靠表现几何形状来三角形高质量深度。但是,多视图方法的准确性和鲁棒性在很大程度上依赖于相机的几何配置以及视图之间匹配的对应关系。首先,需要足够翻译相机以进行三角度。在自主驾驶的情况下,汽车可能会停在交通信号灯处或不移动而不移动,这会导致故障三角剖分。此外,多视图方法遭受动态对象和无动电区域的影响,它们在自动驱动方案中无处不在。另一个问题是对移动车辆的施加优化。在存在的大满贯方法中不可避免地噪声,更不用说具有挑战性和可取的情况了。具体来说,我们提出了一个两个分支网络,即例如,一辆机器人或自动驾驶汽车可以在不重新校准的情况下部署多年,原因是嘈杂的姿势。相比之下,作为单视图方法[14 - 16,19,37,38]依赖于对场景的语义理解和透视投影提示,它们对无纹理区域,动态对象,而不是依赖相机姿势更为易用。但是,由于规模歧义,其性能仍然远非多视图方法。在这里,我们倾向于考虑是否可以很好地结合两种方法的好处,以实现自主驾驶场景中的稳健和准确的单眼视频深度估计。尽管已经在先前的工作中探索了基于融合的系统[1,9],但他们都假定了理想的相机姿势。结果是融合系统的性能甚至比单视深度估计的噪声姿势还差。为了解决这个问题,我们提出了一个新型的自适应融合网络,以利用多视图和单视图方法的优势,并减轻其缺点,以保持高度的精度,并在噪声姿势下提高系统的影响力。一个靶向单眼深度提示,而另一个则利用多视图几何形状。两个分支都预测了深度图和置信图。补充语义提示和边缘细节在多视图分支的成本汇总中丢失了
摘要 - 越野自治,对于诸如搜索,农业和行星探索等应用的至关重要,由于挑战地形而构成了独特的问题,以及由于测试或部署此类系统所涉及的风险。可访问的平台有可能扩大领域,向更广泛的研究人员和学生扩大。现有的使公路自治更容易获得的努力已经取得了成功,但积极进取的越野自主权仍然服务不足。我们寻求通过引入Hound(1/10尺度,廉价,越野自动驾驶汽车平台)来填补这一差距,该平台可以在高速上处理具有挑战性的室外地形。为了帮助开发速度,我们将猎犬与BeamNG集成在一起,BeamNG是一种最先进的驾驶模拟器,以启用循环中的软件以及循环测试中的硬件。为了减少所需的坚固化程度,因此,我们将预防系统作为安全功能集成到平台中。现实世界中的试验超过50公里,证明了平台在各种地形和速度上的寿命和有效性。构建说明,数据集和代码通过:https://sites.google.com/view/prl-hound/home/home
摘要:使自动驾驶汽车能够在轮胎部队饱和的情况下可靠地在Handling的范围内可靠运行,这将提高其安全性,尤其是在诸如紧急障碍避免或不利天气状况之类的情况下。然而,由于任务的动态性和对道路,车辆及其动态相互作用的不确定特性的高灵敏度,解锁此能力是具有挑战性的。是出于这些挑战的动机,我们提出了一个框架,以使用包含来自不同环境中不同车辆的轨迹的未标记数据集学习有条件的扩散模型,以进行高性能车辆控制。我们设计了扩散模型,以通过物理知识数据驱动的动力学模型的参数的多模式分布来捕获复杂数据集的轨迹分布。通过调节在线测量中的生成过程,我们将扩散模型集成到一个实时模型预测控制框架中,以限制驾驶,并证明它可以在频率上适应给定的车辆和环境。在Toyota Supra和Lexus LC 500上进行的广泛实验表明,单个扩散模型在不同的轮胎在不同的道路条件下使用不同的轮胎时,可以在两辆车上进行可靠的自动漂移。该模型与任务特定的专家模型的性能相匹配,同时以概括性的概括为单位,铺平了迈向一般,可靠的方法,以在处理范围内进行自动驾驶。
本文为自动驾驶汽车的避免碰撞挑战提供了一种创新的优化解决方案。提出的方法包括一个在线运动计划者,旨在定义可行有效的途径,能够处理动态环境,同时隐含地确保拟议的演习中的安全性。考虑在运动计划者内部移动障碍的事实增加了问题的复杂性,而迫使它像其他人一样频繁地执行。为了降低这种计算复杂性,该方法以两个阶段的翻译进行了计数,将常用的非线性优化结构的两个阶段翻译成QP公式,可以很容易地解决。第一阶段是基于在车辆的动态约束中使用LPV矩阵。第二阶段包括基于设定的传播进行可及性分析,以获取可保证安全条件的允许输入和可触及状态的线性表达式。