摘要 无人机图像中的车辆检测和识别是一个复杂的问题,已用于不同的安全目的。这些图像的主要挑战是从斜角捕获的,并带来了一些挑战,例如不均匀的照明效果、退化、模糊、遮挡、能见度丧失等。此外,天气条件在引起安全问题方面起着至关重要的作用,并为收集的数据增加了另一个高水平的挑战。在过去的几十年里,人们采用了各种技术来检测和跟踪不同天气条件下的车辆。然而,由于缺乏可用数据,在大雪中检测车辆仍处于早期阶段。此外,还没有使用无人机 (UAV) 拍摄的真实图像在雪天检测车辆的研究。本研究旨在通过向科学界提供北欧地区不同环境和不同积雪条件下无人机拍摄的车辆数据来解决这一空白。数据涵盖不同的恶劣天气条件,如阴天降雪、低光照和低对比度条件、积雪不均、高亮度、阳光、新雪,以及温度远低于-0摄氏度。该研究还评估了常用物体检测方法(如 YOLOv8s、YOLOv5s 和 Faster RCNN)的性能。此外,还探索了数据增强技术,并提出了在此类场景中增强检测器性能的技术。代码和数据集将在 https://nvd.ltu-ai.dev 上提供
在华盛顿西雅图举行的2024 IEEE/CVF计算机视觉和模式识别会议上!CVPR是IEEE/CVF和PAMI-TC的首要和旗舰年会,我们社区中的研究人员在理论和实践中介绍了他们在计算机视觉,模式识别,机器学习,机器人和人工智能方面的最新进展。我们的计划包括邀请的主题演讲,口头和海报演示,面板,教程,讲习班,演示,展览和社交活动,旨在为与会者提供令人兴奋且丰富的体验。CVPR 2024主要是一个面对面的会议,但是对于那些无法身体上加入我们的人,我们很高兴提供一个虚拟组件,该虚拟组件将访问会议论文,海报,视频和演讲。
转导的推论已通过几片图像分类进行了广泛研究,但在最近的,快速增长的文献中,有关适应视觉模型(如剪辑)的文献被完全忽略了。本文介绍了转换零射击和少量剪辑的分类,其中在其中共同进行推理,在一批无标记的查询样品中共同执行,而不是独立处理每个实例。我们最初构建了信息性的文本概率特征,从而在单元单元集中导致分类问题。受期望最大化(EM)的启发,我们基于优化的分类目标使用Dirichlet定律对每个类别的数据概率分布进行模型。然后使用一种新颖的块最小化最小化算法来解决最小化问题,该算法同时估计分布参数和类分配。在11个数据集上进行的广泛的Numerical实验强调了我们批处理推理方法的效果和效率。在带有75个样本的测试批次的零摄像任务上,我们的APARCH产量比Clip的零弹性性能提高了20%的ImageNet准确性。此外,我们在几次设置中胜过最先进的方法。代码可在以下网址提供:https://github.com/ segolenemartin/trandductive-clip。
主动深度传感可实现强大的深度估计,但通常受感应范围的限制。天真地增加光学能力可以改善传感范围,但对许多应用(包括自主机器人和增强现实)的视力安全关注。在本文中,我们提出了一个自适应的主动深度传感器,该传感器可以共同介绍范围,功耗和眼部安全。主要观察结果是,我们不需要将光模式投影到整个场景,而只需要在关注的小区域中,在应用程序和被动立体声深度所需的深度失败的情况下。理论上将这种自适应感知方案与其他感应策略(例如全帧投影,线扫描和点扫描)进行了比较。我们表明,为了达到相同的最大感应距离,提出的方法在最短(最佳)眼部安全距离时会消耗最小的功率。我们用两个硬件原型实现了这种自适应感测方案,一个具有仅相位空间光调制器(SLM),另一个带有微电动机械(MEMS)镜像和衍射光学元素(DOE)。实验结果验证了我们方法的优势,并证明了其能力自适应地获得更高质量的几何形状。请参阅我们的项目网站以获取视频结果和代码:
单光子光检测和范围(LIDAR)系统通常配备一系列检测器,以提高空间分辨率和传感速度。但是,考虑到激光跨场横跨场景产生的固定量磁通量,当更多像素在单位空间中堆积时,每像素信号到噪声(SNR)将减小。这在传感器阵列的空间分辨率与每个像素的SNR之间的空间分辨率之间提出了基本的权衡。探索了这种基本限制的理论表征。通过得出光子竞争统计量并引入一系列新的近似技术,得出了时间延迟的最大样品估计器的平均平方误差(MSE)。理论预测与模拟和实际数据良好。
中世纪手稿的稳定数字化正在迅速改变古编目的领域,这挑战了关于手写和书籍生产的假设。这一发展已经确定了历史上重要的文字文本,甚至个人抄写本身。例如,已故中世纪英语文学的学者确定了许多文学手稿的抄写者,以及伦敦政府秘书在塑造文学文化中的重要作用。然而,传统的古学尚无协议的方法或固定标准,可以将手写归因于特定社区,时期或抄写员。古存者采用的方法本质上是定性的,并且存在着人的偏见。即使是那些挥舞着强大的“古征象者”的人也无法声称客观性。计算机视觉提供了在作者识别和检索基准方面具有出色表现的解决方案,但是古老社区并未广泛采用这些方法,因为它们往往不会在实践中坚持下去。在这项工作中,我们试图用旨在自动化古征学的软件包桥接鸿沟,而是要增强古造型者的眼睛。我们介绍了自动手写识别工具,可以在视觉上快速理解和评估结果,并在归因于以前未知的抄写员时,将其用作众多专家的一项功能。我们还通过分析托马斯·霍克夫夫(Thomas Hoccleve)撰写的几个物品(私人印章的高产店员),也是一个重要的十五世纪英语诗人,我们还为我们的软件展示了一个用例。
事件相机具有高时间分辨率、高动态范围、低功耗和高像素带宽等特点,为特殊环境中的物体检测提供了独特的功能。尽管有这些优势,事件数据固有的稀疏性和异步性对现有的物体检测算法提出了挑战。脉冲神经网络 (SNN) 受到人脑编码和处理信息方式的启发,为这些困难提供了潜在的解决方案。然而,在当前的实现中,它们在使用事件相机进行物体检测方面的性能受到限制。在本文中,我们提出了脉冲融合物体检测器 (SFOD),一种基于 SNN 的简单有效的物体检测方法。具体而言,我们设计了一个脉冲融合模块,首次实现了应用于事件相机的 SNN 中不同尺度特征图的融合。此外,通过整合我们在 NCAR 数据集上对主干网络进行预训练期间进行的分析和实验,我们深入研究了脉冲解码策略和损失函数对模型性能的影响。从而,我们建立了基于 SNN 的当前最佳分类结果,在 NCAR 数据集上实现了 93.7% 的准确率。在 GEN1 检测数据集上的实验结果表明,SFOD 实现了 32.1% 的当前最佳 mAP,优于现有的基于 SNN 的方法。我们的研究不仅强调了 SNN 在事件摄像机物体检测中的潜力,而且推动了 SNN 的发展。代码可在 https://github.com/yimeng-fan/SFOD 获得。
以生物风格的活动相机跟踪近年来引起了人们的兴趣。现有的作品要么利用对齐的RGB和事件数据进行准确跟踪,要么直接学习基于事件的跟踪器。前者会产生较高的推理成本,而后者可能容易受到嘈杂事件或稀疏空间分辨率的影响。在本文中,我们提出了一个新型的分层知识蒸馏框架,该框架可以在培训期间完全利用多模式 /多视图信息,以促进知识转移,使我们能够仅使用事件信号来实现测试过程中高速和低潜伏期视觉跟踪。特别是,基于教师变压器的多模态跟踪框架首先是通过同时喂食RGB框架和事件流来训练的。然后,我们设计了一种新的分层知识蒸馏策略,其中包括成对相似性,功能表示和基于响应地图的知识蒸馏,以指导学生变形金刚网络的学习。在术语中,由于现有的基于事件的跟踪数据集都是低分辨率(346×260),因此我们提出了名为EventVot的第一个大规模高分辨率(1280×720)数据集。它包含1141个视频,并涵盖了许多类别,例如行人,车辆,无人机,乒乓球等。对低分辨率(Fe240Hz,Vi-Sevent,Coesot)和我们新提出的高分辨率EventVot数据集的进行了实验进行了实验
本文档是前两个任务的最终报告。弗吉尼亚级承包商合作研究已经提交给国防部(Blickstein、Held 和 Venzor,2003 年)。在执行前两个任务时,我们采用了一种通用方法:我们首先试图了解当前的建设、支持和补充计划,以建立可以采取成本削减措施的基准。接下来,我们确定了这些措施。最后,我们评估了成本削减措施,以确定其中哪些措施可能产生最实质性的影响,同时关注技术成熟度和风险问题。在执行这种方法时,我们广泛依赖英国国内外相关收购计划的经验。我们采访了国防部、两家 CVF 承包商、美国海军以及商业造船厂和支持公司的人员。我们还借鉴了为其他收购相关项目开发的 RAND 模型。这项研究是在项目处于竞争阶段时进行的,当时有两家公司参与。2003 年 1 月,国防部、BAE 系统公司和泰雷兹英国公司组成的联盟被选中负责该项目。宣布这一消息后,泰雷兹的设计被选中继续推进。该设计随后得到开发和完善。虽然我们已经确定了许多降低成本的措施,但我们对这些措施的评估并不像我们希望的那样严格或明确,主要是因为 CVF 设计仍在发展中;因此并不总是能够获得关于现有设计各方面的足够详细数据。这些
○CE Zheng,Matias Mendieta和Chen Chen。 “海报:用于面部表达识别的金字塔交叉融合变压器网络”。 IEEE/CVF国际计算机视觉会议的会议记录。 IEEE/CVF国际计算机视觉会议的会议记录。 (ICCV研讨会2023)○CE Zheng,Matias Mendieta和Chen Chen。“海报:用于面部表达识别的金字塔交叉融合变压器网络”。IEEE/CVF国际计算机视觉会议的会议记录。 IEEE/CVF国际计算机视觉会议的会议记录。 (ICCV研讨会2023)IEEE/CVF国际计算机视觉会议的会议记录。IEEE/CVF国际计算机视觉会议的会议记录。 (ICCV研讨会2023)IEEE/CVF国际计算机视觉会议的会议记录。(ICCV研讨会2023)