13. 摘要(最多 200 个字)无人机系统 (UAS) 的普及加剧了恶意行为者利用该技术进行恶作剧或伤害的不对称威胁。现有的地面解决方案受到视线的限制,而人工操作的响应无人机响应速度较慢且劳动强度较大。因此,需要具备基于视觉的自主追击和拦截未经授权的无人机的能力。为了解决这个问题,作者开发了一种计算机视觉 (CV) 算法,用于在现场条件下检测、跟踪和估计悬停和移动的空中小型 UAS 目标的相对位置和范围。将基于 CV 的测量结果与 GPS 数据进行比较,以评估 CV 算法的范围和角度估计性能。然后,飞行控制算法利用简单的角度制导原理处理 CV 估计的范围和角度信息以追击和拦截目标。使用原型无人机对该算法进行了现场测试。这项研究将为商用现货反无人机能力的概念设计和硬件实现选择提供参考。更广泛地说,这项研究为自主物体跟踪应用的知识体系做出了贡献。
人类行动质量评估(AQA)旨在自动评估人类执行的行动的表现,是人类行动分析的一个新兴领域。尽管已经为人类行动分析领域(例如行动识别和行动预测)进行了许多评论文章,但缺乏与AQA相关的最新和系统评价。本文旨在提供有关基于视觉的人类AQA的现有论文的系统文献综述。这项系统的审查是按照Scopus,IEEE Xplore和Web of Science的数据库进行严格进行的,于2024年7月。96个研究文章进行最终分析。本评论概述了AQA的各个方面,包括现有应用程序,数据采集方法,公共数据集,最新方法和评估指标。我们观察到自2019年以来的AQA研究数量增加,这主要是由于深度学习方法和运动捕获设备的出现。我们根据所使用的数据模式将这些AQA方法分类为基于骨架和基于视频的方法。各种AQA任务的评估指标不同。src是最常用的评估度量标准,在96个选定的论文中,有56个使用它来评估其模型。体育赛事评分,手术技能评估和康复评估是根据现有论文在这个方向上最受欢迎的三种情况,并且正在探索更多新的情况,例如钢琴技能评估。此外,还提供了现有的挑战和未来的研究方向,这可能是研究人员探索AQA的有用指南。
抽象溺水是一个重要的公共健康问题。视频溺水检测算法是找到溺水受害者的有用工具。但是,溺水研究研究的三个挑战通常会遇到:缺乏实际的溺水视频数据,微妙的早期溺水特征以及缺乏实时时间。在本文中,作者提出了一个水下计算机视觉的溺水检测装置,该检测设备由嵌入式AI设备,相机和防水外壳组成,以解决上述问题。检测设备利用Jetson Nano的高性能计算通过在获得的水下视频流中提出的溺水检测算法实现溺水事件的实时检测。所提出的溺水检测算法主要由两个阶段组成:在第一步中,成功地解决了周围环境的干扰,并为视频溺水检测提供了值得信赖的基础,Yolov5N网络用于根据溺水者的特征来检测近事实的人体。在第二阶段,作者提出了一个基于深层高斯模型,用于快速特征向量检测。轻巧的DDN与高斯模型相结合,以检测高级语义特征的异常,该功能具有更高的鲁棒性,并解决了缺乏溺水视频的缺乏。实验结果表明,所提出的溺水检测算法具有良好的全面性能和实际应用值。
摘要 目的:NEVArt 研究旨在研究在真实的博物馆环境中观察 18 幅不同的 16-18 世纪画作时,大约 500 名实验对象的一组神经生理/情绪反应与审美水平之间的相关性。方法:记录了几种生物信号来评估参与者在观察画作时的反应。其中:(a) 使用可穿戴工具记录神经植物、运动和情绪生物信号,用于 EEG(脑电图)、ECG(心电图)和 EDA(皮肤电活动);(b) 观察艺术作品时的注视模式,而 (c) 获得了参与者的数据(年龄、性别、教育程度、对艺术的熟悉程度等)及其对画作的明确判断。参与者被邀请在观察画作期间做出反应,报告愉悦程度、感知到的运动和对绘画主题的熟悉程度。结果:每个记录的生物信号将与参与者在研究期间获得的明确评估相关联
我们解决这个问题的方法遵循一个两阶段流程:(1)自我运动估计和(2)检测和跟踪。这两个阶段都是完全卷积神经网络,可以扩展到高分辨率输入。它们在 Amazon Prime Air 发布的标记数据集上进行训练,该数据集包含 330 多万张飞机、直升机、无人机和其他飞行物体的图像。我们还开发了自己的飞机数据收集系统,并设计了一个定制的基于视觉的 DAA 有效载荷,用于飞行中相遇。通过对现实世界数据进行实证评估,我们的方法与两种基线检测和跟踪架构进行了比较,结果显示我们的方法更胜一筹。在 DAA 行业标准 (ASTM F3442/F3442M - 20) 的背景下分析我们的定量结果,我们还表明,所提出的方法可以满足某些类别的无人机的视觉 DAA 监视要求,这些无人机的最低巡航速度为 60-90kts,最低转弯率为 21-31 度/秒,最低爬升率为 250-500 英尺/分钟。
在定位和跟踪应用中,位置估计的准确性受到能够提供相对目标测量值的传感器/信标数量的影响。虽然单个传感器/信标是最容易实现的系统,但必须进行多次测量才能确保位置信息的准确性。多个传感器/信标可以实现更及时的位置验证,但会增加系统复杂性。例如,传感器/信标的属性及其相对于目标物体的几何形状会影响系统的准确性。如果相同的传感器/信标太近,它们将提供几乎相同的信息,对知识库的补充很少。如果传感器/信标相距太远,可能会遗漏一些重要信息。因此,最佳传感器/信标间距介于这两个极端之间。本文将进一步探讨一种控制传感器/信标阵列几何形状的方法,以在实验期间保持最佳跟踪性能配置。
摘要 — 本文主要研究基于视觉的无人机导航障碍物检测与跟踪问题。通过将物体检测和跟踪有效地集成到动态卡尔曼模型中,开发了一种单目图像序列的实时物体定位和跟踪策略。在检测阶段,通过每帧图像背景连通性提示计算出的显著性图自动检测和定位感兴趣的物体;在跟踪阶段,采用卡尔曼滤波器对物体状态进行粗略预测,然后通过结合显著性图和两个连续帧之间的时间信息的局部检测器进一步细化预测。与现有方法相比,所提出的方法不需要任何手动初始化跟踪,运行速度比同类最先进的跟踪器快得多,并且在大量图像序列上实现了具有竞争力的跟踪性能。大量实验证明了所提出方法的有效性和优越性能。
摘要 - 全球超过230万人每年患有与工作有关的伤害或疾病,每天导致6,000多人死亡。提供一个不清楚的工作环境和未能佩戴适当的个人防护设备已被确定为工作场所事故的重要贡献者,这使得雇主必须将工作场所安全性优先级作为当务之急。提供适当的个人防护设备(PPE)并维护良好的,明确的(不安全)的工作环境可以帮助防止不便的工作场所事件。此外,它促进了安全的工作环境,减少了威胁生命的事件的可能性,并增强了整体业务和经济状况。因此,本文通过实施计算机视觉技术来检测工人所穿的适当PPE,并确保一个安全的工作空间来降低人身伤害的风险,从而提出了安全,智能的制造。通过利用计算机视觉技术,我们可以识别PPE,例如手套,头盔和工作叉车,由工人在制造环境中使用。对于两个数据集中的所有类,都使用Yolov8达到了80.6%和86%的精度。通常,考虑了两个数据集的广泛审查,包括五个性能指标。
在一个专门用于图像和数字宇宙之间的交叉的社论生产中,在生成性艺术的智能的出现下,它倾向于某种陈述和视觉技术的单层概念,而詹姆斯·杜布森(James E.这本书确实与所谓的计算机视觉学科(计算机视觉)完全相关,并探讨了最常见的自动理解,分析和解释图像的原始方法。这项历史性调查的起点是对OpenCV的研究,OpenCV是一个开源库,于1999年汇集了数千算法,这些算法是在计算机视觉领域中引用的,如今已在各种目的使用,从无处不在的监测系统的电话中使用。是由该来源的来源部署了他的家谱努力,可以追溯到冷战的背景下北美军事工业建筑群的进步,本质上是围绕开发自动解释陆军空中照片和面部识别方法的技术问题。
现有的先验使用预先训练的重量作为中心,这可能会构成对目标数据适应不足的严重风险。在[ICML2020-LI]中,我们提出了一种步枪方法,该方法会积极忘记通过在细调过程中重新定位完全连接的层所学到的东西,以增强目标适应性。学习过程的稳定性主要是由于模型崩溃或信息理论中输入和输出的异常相互信息。模型崩溃可以通过跨层相互信息的变化来检测。在[ICASSP 2023-LI]中,我们基于信息的感应偏见补充了现有的先验,以偏爱具有稳定信息传播的网络,以降低模型崩溃率并提高模型稳定性。我们进一步开发了具有可牵引概括的新先验,以鼓励微调模型对输入噪声不敏感[NAACL2021-LI]。(用于bert微调的噪声稳定性正则化)