当前用于自动驾驶计算机视觉的深层神经网络(DNNS)通常在仅涉及单一类型的数据和urban场景的特定数据集上进行培训。因此,这些模型努力使新物体,噪音,夜间条件和各种情况,这对于安全至关重要的应用至关重要。尽管持续不断努力增强计算机视觉DNN的弹性,但进展一直缓慢,部分原因是缺乏具有多种模式的基准。我们介绍了一个名为Infraparis的新颖和多功能数据集,该数据集支持三种模式的多个任务:RGB,DEPTH和INDRARED。我们评估了各种最先进的基线技术,涵盖了语义分割,对象检测和深度估计的任务。更多可视化和
将驾驶行为适应新的环境,库斯和法律是自主驾驶中的一个长期问题,排除了澳大利亚车辆(AVS)的广泛部署。在本文中,我们提出了LLADA,这是一种简单而强大的工具,它使人类驾驶员和自动驾驶汽车都可以通过调整其任务和动作计划来在新的地方进行访问规则,从而在任何地方开车。llada通过利用大型语言模型(LLMS)在解释本地驾驶员手册中的流量规则方面的令人印象深刻的零弹性可推广性来实现这一目标。通过广泛的用户研究,我们表明LLADA的说明可用于消除野外野外未受的情况。我们还展示了LLADA在现实世界数据集中适应AV运动计划策略的能力; Llada优于我们所有指标的基线计划。请查看我们的网站以获取更多详细信息:Llada。
广泛应用于自主驾驶中的基于深度学习的单眼深度估计(MDE)很容易受到对抗性攻击的影响。先前针对MDE模型的物理攻击依赖于2D广泛的补丁,因此它们仅影响MDE地图中的一个小型局部区域,但在各种观点下都失败了。为了解决这些限制,我们提出了3D深度傻瓜(3d 2傻瓜),这是对MDE模型的第一个基于3D纹理的对抗性攻击。3d 2傻瓜被专门优化,以生成3D对抗纹理对型号的车辆类型,并在恶劣天气条件(例如雨水和雾)中具有改善的鲁棒性。实验结果验证了我们3d 2傻瓜在各种情况下的出色性能,包括车辆,MDE Mod-els,天气状况和观点。现实世界中使用打印3D纹理的实验实验进一步表明,我们的3d 2傻瓜可能会导致超过10米的MDE误差。该代码可在https://github.com/gandolfczjh/3d2fool上找到。
来自图像的深度估计是具有广泛应用的计算机视觉中的一个长期问题。对于基于视觉的自动驾驶系统,感知深度是理解道路对象和建模3D环境图的相关性的不可或缺的模块。由于深度神经网络用于求解各种视觉概率,因此基于CNN的方法[2-5,13,39 - 42,44,44,46,48,52]主导了各种深度基准。根据输入格式,它们主要将其分为多视图深度估计[3,13,23,26,44,45,51,53]和单视深度估计[14 - 16,19,37,38]。多视图方法估计深度的假设,即给定的深度,相机校准和摄像头姿势,这些像素应相似。他们依靠表现几何形状来三角形高质量深度。但是,多视图方法的准确性和鲁棒性在很大程度上依赖于相机的几何配置以及视图之间匹配的对应关系。首先,需要足够翻译相机以进行三角度。在自主驾驶的情况下,汽车可能会停在交通信号灯处或不移动而不移动,这会导致故障三角剖分。此外,多视图方法遭受动态对象和无动电区域的影响,它们在自动驱动方案中无处不在。另一个问题是对移动车辆的施加优化。在存在的大满贯方法中不可避免地噪声,更不用说具有挑战性和可取的情况了。具体来说,我们提出了一个两个分支网络,即例如,一辆机器人或自动驾驶汽车可以在不重新校准的情况下部署多年,原因是嘈杂的姿势。相比之下,作为单视图方法[14 - 16,19,37,38]依赖于对场景的语义理解和透视投影提示,它们对无纹理区域,动态对象,而不是依赖相机姿势更为易用。但是,由于规模歧义,其性能仍然远非多视图方法。在这里,我们倾向于考虑是否可以很好地结合两种方法的好处,以实现自主驾驶场景中的稳健和准确的单眼视频深度估计。尽管已经在先前的工作中探索了基于融合的系统[1,9],但他们都假定了理想的相机姿势。结果是融合系统的性能甚至比单视深度估计的噪声姿势还差。为了解决这个问题,我们提出了一个新型的自适应融合网络,以利用多视图和单视图方法的优势,并减轻其缺点,以保持高度的精度,并在噪声姿势下提高系统的影响力。一个靶向单眼深度提示,而另一个则利用多视图几何形状。两个分支都预测了深度图和置信图。补充语义提示和边缘细节在多视图分支的成本汇总中丢失了
我们应对行人模拟中的内容多样性和收获性的挑战,以驱动方案。最近的行人动画框架具有重要的限制,其中他们主要关注轨迹[48]或参考视频[60]的内容,因此忽略了这种情况下人类运动的潜在多样性。这种限制限制了产生行人行为的能力,这些行为表现出更大的变化和现实动作,因此重新严格使用其用法,为驾驶模拟系统中的其他组件提供丰富的运动内容,例如,突然改变了自动驾驶汽车应响应的运动。在我们的方法中,我们努力通过展示从各种来源获得的各种人类动作(例如生成的人类运动)来超越限制,以遵循给定的轨迹。我们的框架的基本贡献在于将运动跟踪任务与轨迹结合到以下,这可以跟踪特定运动零件(例如上半身),同时遵循单个策略的给定轨迹。以这种方式,我们在给定情况下显着增强了模拟人类运动的分歧,以及内容的可控性,包括基于语言的控制。我们的框架有助于生成
实现强大而实时的3D感知是自动驾驶汽车的基础。虽然大多数现有的3D感知方法优先考虑检测准确性,但十个忽略了关键方面,例如计算效率,板载芯片部署友好性,对传感器安装偏差的韧性以及对各种VE-HILE类型的适应性。为了应对这些挑战,我们提出了nvautonet:一种专业的鸟类视图(BEV)感知网络 - 针对自动化车辆的明确量身定制。nvautonet将同步的相机图像作为输入,并预测3D信号(例如障碍物,自由空间和停车位)。NVAUTONET架构(图像和Bev Back-bones)的核心依赖于有效的卷积网络,该网络使用Tensorrt优化了高性能。我们的图像到BEV转换采用简单的线性层和BEV查找表,从而确保了快速推理速度。Nvautonet在广泛的专有数据集中受过培训,在NVIDIA DRIVE ORIN SOC上以每秒53帧的速度运行,始终达到升高的感知精度。值得注意的是,Nvautonet表现出对不同汽车模型产生的偏差偏差的韧性。此外,Nvautonet在适应各种车辆类型方面表现出色,这是通过廉价模型的微调程序来促进的,可以加快兼容性调整。
自动驾驶汽车(SDVS)的抽象开发人员与可能的未来有一个特定的想法。公众不得分享其基于的假设。在本文中,我们分析了英国调查(N¼4,860)和美国(n¼1,890)公众的自由文本响应,这些公众询问受访者在想到SDV时会想到什么弹簧,以及为什么应该或不应该开发它们。响应(平均每个参与者的总共27个单词)倾向于提出安全的希望,并且更常规地担心。许多受访者都提出了技术,其他道路使用者与未来之间关系的替代书籍。而不是接受一种主导的公众参与方法,该方法试图使公众从这些观点中教育,而是建议这些观点应视为社会情报的来源,并为建立更好的运输系统做出了潜在的建设性贡献。预期治理,如果要包容,则应寻求理解和整合公众观点,而不是拒绝它们是不合理的或可变的。
Abstract ....................................................................................................................................................ii
- 消除公私合作伙伴关系的障碍,以加速气候行动项目,市长的信件旨在解锁绿色基础设施和可持续城市增长的急需资金。Urbanshift Africa论坛还将发布有关全球南部城市可持续财务行动和倡导的新路线图,该图案概述了市长及其团队可以开始行动并提倡气候行动的实际步骤。来自C40,Urbanshift和全球气候和能源市长盟约(GCOM)的新资源将帮助市长为清洁能源和公共交通等重要项目提供负担得起的融资。路线图(链接将于2月17日星期一1700次上线)还建议为城市提供更多的财务独立性,创建国家平台以协调努力,并将项目分组在一起,以吸引更多的投资。Freetown市长,C40城市的联合主席 Yvonne Aki-Sawyerr说:“非洲城市已经处于气候行动和创新的先锋范围内。 我们的青年人口已经在拥护气候行动并投资自己的未来。 “大约有70%的非洲人口35岁,年轻人正在利用技术,创造力和企业家精神来推动向可持续性转变。 现在是时候让国际金融界投资他们的能源和思想了。 “非洲的年轻人口意味着有足够的机会改变许多城市和许多居民的现实。Yvonne Aki-Sawyerr说:“非洲城市已经处于气候行动和创新的先锋范围内。我们的青年人口已经在拥护气候行动并投资自己的未来。“大约有70%的非洲人口35岁,年轻人正在利用技术,创造力和企业家精神来推动向可持续性转变。现在是时候让国际金融界投资他们的能源和思想了。“非洲的年轻人口意味着有足够的机会改变许多城市和许多居民的现实。“我们知道下一代已经准备好领导更绿色,更公平的未来的指控,现在,城市领导者有责任获得他们为我们所有人创造更绿色,更公平的未来所需的资源。”内罗毕州长萨卡贾·约翰逊(Sakaja Johnson)说:“我感到非常兴奋,C40决定主持绿色和韧性的Urbanshift非洲论坛,该论坛将带来非洲大陆上一些最大和领先的城市的代表到内罗毕。我们将继续利用技术和企业家精神来开发清洁能源解决方案,这些解决方案必须伴随着所有人的绿色,更公平的经济模式。“投资非洲的气候解决方案:预计最初投资的$ 1的预计回报为4美元,这是全球投资者的独特机会
