与基于卷积神经网络(CNN)相比,我们研究了基于变压器的行人检测模型较低性能的原因。CNN模型会产生密集的行人建议,单独完善每个建议,然后对其进行非最大抑制(NMS)的跟进,以产生稀疏的预测。在争论中,变压器模型每个地面真相(GT)行人盒选择一个建议,然后从中选择了正面的正态。所有其他建议,其中许多与选定的建议高度相似,都通过了负梯度。尽管这导致了稀疏的预测,从而消除了NM的需求,但在许多类似的建议中,任意选择,有效的训练和较低的行人检测准确性。为了减轻问题,我们建议基于Min-Cost-Flow的配方,而不是常用的Kuhn-Munkres匹配算法,并纳入了诸如每个地面真相盒的约束,并且与一个建议的提案相匹配,并且许多同样好的建议可以与单个地面真相盒相匹配。我们提出了基于匹配算法的第一个基于变压器的行人检测模型。广泛的实验表明,我们的方法达到了3个失误率(较低)3。7 /17。4 /21。8/8。3/2。0在Eurocity / tju-traffic / tju-校园 /城市专家 /加州理工学院数据集中,而4个。7/18。7/24。8/8。5/3。 1通过当前的sota。 代码可从https://ajayshastry08.github.io/flow_ matcher 获得。5/3。1通过当前的sota。代码可从https://ajayshastry08.github.io/flow_ matcher
对抗训练(AT)是提高深度神经网络鲁棒性的最常用机制。最近,一种针对中间层的新型对抗攻击利用了对抗训练网络的额外脆弱性,输出错误的预测。这一结果说明对抗训练中对抗扰动的搜索空间不足。为了阐明中间层攻击有效的原因,我们将前向传播解释为聚类效应,表征神经网络对于与训练集具有相同标签的样本的中间层表示相似,并通过相应的信息瓶颈理论从理论上证明了聚类效应的存在。随后我们观察到中间层攻击违反了 AT 训练模型的聚类效应。受这些重要观察的启发,我们提出了一种正则化方法来扩展训练过程中的扰动搜索空间,称为充分对抗训练(SAT)。我们通过严格的数学证明给出了经过验证的神经网络鲁棒性界限。实验评估表明,SAT 在防御针对输出层和中间层的对抗性攻击方面优于其他最先进的 AT 机制。我们的代码和附录可以在 https://github.com/clustering-effect/SAT 找到。
对象检测在各种自主系统中至关重要,例如监视,自动驾驶和驾驶员的稳定性,通过识别行人,车辆,交通信号灯和标志来确保安全。然而,诸如雪,雾和雨等不利天气条件构成了挑战,具有检测准确性,冒险发生事故和大坝。这清楚地表明了在所有天气条件下都起作用的强大观察检测解决方案的必要性。我们采用了三种策略来增强不利天气中的基于深度学习的对象检测:对全球全天候图像进行培训,对图像进行培训,并具有合成的增强天气噪声,并将对象的变形与不利天气图像denosistighting进行整合。使用分析方法,GAN网络和样式转移网络产生合成天气噪声。我们使用BDD100K数据集中的真实世界全天候图像和用于评估未见现实世界的不利天气图像的评估,通过训练对象进行分割模型比较了这些策略的性能。通过降级现实世界的不利天气图像以及对物体检测的结果和原始嘈杂图像的结果进行了评估,从而评估了不利天气。我们发现,使用全天候现实世界图像训练的模型表现最佳,而对对象检测进行对象检测的策略则表现最差。
雷达相机3D对象检测旨在与雷达信号与摄像机图像进行交互,以识别感兴趣的对象并定位其相应的3D绑定框。为了克服雷达信号的严重稀疏性和歧义性,我们提出了一个基于概率deno的扩散建模的稳健框架。我们设计了框架,可以在不同的多视图3D检测器上易于实现,而无需在训练或推理过程中使用LiDar Point Clouds。在特定的情况下,我们首先通过开发带有语义嵌入的轻质DENOIS扩散模型来设计框架编码器。其次,我们通过在变压器检测解码器的深度测量处引入重建训练,将查询降解训练开发为3D空间。我们的框架在Nuscenes 3D检测基准上实现了新的最新性能,但与基线检测器相比,计算成本的增加很少。
描述 沉箱是一种安全、防水的舱室,通常用于水下施工。通过添加压缩空气使舱室防水。战略环境研究与发展计划 (SERDP) 项目 MR-2648“建立坚固的沉箱结构以抵抗水下未爆炸弹药就地爆炸的影响”研究了沉箱作为防爆盾的使用。计算机模拟发现,SERDP 团队开发的坚固沉箱结构 (RCS) 模型能够显著降低水下爆炸的影响。
将几何模型拟合到离群污染数据上是可证明的难点。许多计算机视觉系统依靠随机抽样启发式方法来解决稳健拟合问题,但这种方法不提供最优性保证和误差界限。因此,开发新方法来弥合成本高昂的精确解决方案与无法提供质量保证的快速启发式方法之间的差距至关重要。在本文中,我们提出了一种用于稳健拟合的混合量子经典算法。我们的核心贡献是一种新颖的稳健拟合公式,它可以解决一系列整数程序并以全局解或误差界限终止。组合子问题适合量子退火器,这有助于有效地收紧界限。虽然我们对量子计算的使用并没有克服稳健拟合的根本难点,但通过提供误差界限,我们的算法是对随机启发式算法的实际改进。此外,我们的工作代表了量子计算在计算机视觉中的具体应用。我们展示了使用实际量子计算机(D-Wave Advantage)和通过模拟 1 获得的结果。
H ∞ 滤波器针对的是噪声过程统计数据不确定的情况,此时我们的目标是最小化最坏情况而不是估计误差的方差 [ 3 , 26 ]。该滤波器限制了将扰动映射到估计误差的传递函数的 H ∞ 范数。然而,在瞬态操作中,会失去所需的 H ∞ 性能,并且滤波器可能会发散,除非每次迭代中都有一些(通常是限制性的)正性条件成立。在集值估计中,扰动向量通过有界集(如椭球)建模 [ 4 , 22 ]。在该框架中,我们试图围绕与观测值和外生扰动椭球一致的状态估计构建最小椭球。然而,由此产生的稳健滤波器会忽略任何分布信息,因此倾向于过于保守。 [19] 首次研究了一种对更一般形式的(基于集合的)模型不确定性具有鲁棒性的滤波器。该滤波器以迭代方式最小化标准状态空间模型附近所有模型的最坏情况均方误差。虽然该滤波器在面对较大不确定性时表现良好,但在较小不确定性下可能过于保守。[25] 提出了一种广义卡尔曼滤波器,它可以解决这个缺点,在标准性能和最坏情况性能之间取得平衡。通过最小化矩生成函数而不是估计误差平方的均值,可以得到风险敏感的卡尔曼滤波器 [24]。这种风险敏感的卡尔曼滤波器等同于 [12] 中提出的分布鲁棒滤波器,它最小化标准分布周围的 Kullback-Leibler (KL) 球中所有联合状态-输出分布的最坏情况均方误差。 [27] 研究了更一般的 τ -散度球的扩展。
协作感知允许在多个代理(例如车辆和基础)之间共享信息,以通过交流和融合来获得对环境的全面看法。当前对多机构协作感知系统的研究通常会构成理想的沟通和感知环境,并忽略了现实世界噪声的效果,例如姿势噪声,运动模糊和感知噪声。为了解决这一差距,在本文中,我们提出了一种新颖的运动感知robus-Busban通信网络(MRCNET),可减轻噪声干扰,并实现准确且强大的协作感知。MRCNET由两个主要组成部分组成:多尺度稳健融合(MRF)通过驱动跨语义的多尺度增强的聚集到不同尺度的融合特征,而运动增强机制(MEM)捕获运动上下文,以补偿动作对物体引起的信息,从而解决了姿势噪声。对流行的协作3D对象检测数据集的实验结果表明,在噪声方案中,MRCNET优于使用较少的带宽感知性能的噪声方案。我们的代码将在https://github.com/indigochildren/collaborative-ception-mrcnet上进行重新释放。
在这项研究中,我们评估了自主驾驶(AD)系统中增强学习的鲁棒性(RL),特别是反对对抗攻击的稳健性。我们采用了Karavolos等人提出的基于Q学习的AD模型。[1]的简单性,是我们分析的基础。此选择使我们能够在简单的Q学习方法和更复杂的RL系统之间进行明显的比较。我们设计了两个威胁模型,以模拟对基于RL的广告系统的对抗性攻击。第一个模型涉及在RL模型的细调中注入未发现的恶意代码,使其容易受到对抗性扰动的影响,这可能会导致在特定的触发条件下碰撞。第二个威胁模型旨在通过直接改变RL模型在特定触发条件下的行动决策来引起碰撞,这代表了一种更隐秘的方法。基于这些威胁模型,我们对两种主要情况的实证研究提出:操纵传感器输入和直接对动作的扰动。研究结果表明,尽管基于RL的AD系统表现出针对传感器输入操纵的弹性,但在受到直接动作扰动时它们会表现出脆弱性。主要的和宽容的场景涉及更改传感器读数,例如在偏心转弯期间,这可能会误导系统并可能导致事故。这对于小误差很大的操作至关重要。第二种情况直接扰动动作,更多地是对基于RL的AD系统脆弱性的理论研究,而不是实用的现实世界威胁。
数字化正在大步前进。数字支付在金融交易中的应用不断深入,可能占到所有金融交易的一半以上,因为目前近 70% 的菲律宾成年人都拥有金融账户。菲律宾央行在公共市场和地方交通系统中广泛使用二维码支付,这增加了地方经济活动并支持了金融包容性。例如,在阿拉米诺斯市,据菲律宾央行称,约 700 名市场摊贩和 3,600 多名三轮车司机积极参与了 Paleng-QR Ph Plus 计划。此外,菲律宾央行还计划将该计划扩大到巴格尤、达沃、塔比拉兰、那牙、拉普拉普、帕西格、巴科洛德、维多利亚、曼达维、奥萨米斯、哥打巴托等城市,以及塔拉克的卡米林镇和甲米地的卡莫纳镇。
