摘要 — 感知和学习算法的进步已使机器人进行人体检测的解决方案越来越成熟,特别是在某些用例中,例如自动驾驶汽车的行人检测或消费者环境中的近距离人体检测。尽管取得了这些进展,但一个简单的问题:哪种传感器-算法组合最适合手头的人体检测任务?仍然很难回答。在本文中,我们通过对机器人技术中常用的传感器-算法组合进行系统的跨模态分析来解决这个问题。我们比较了最先进的人体检测器在具有挑战性的工业用例中对 2D 范围数据、3D 激光雷达和 RGB-D 数据及其选定组合的性能。我们进一步解决了工业目标领域数据稀缺的相关问题,并且最近对 3D 点云中人体检测的研究主要集中在自动驾驶场景上。为了将这些方法上的进步用于机器人应用,我们利用一种简单但有效的多传感器迁移学习策略,通过扩展强大的基于图像的 RGB-D 检测器,以弱 3D 边界框标签的形式为激光雷达检测器提供跨模态监督。我们的结果表明,在检测性能、泛化、帧速率和计算要求方面,不同方法之间存在很大差异。由于我们的用例包含代表广泛服务机器人应用的困难,我们相信这些结果为进一步研究指出了相关的开放挑战,并为从业者设计他们的机器人系统提供了宝贵的支持。
日期 程序 NISTIR 标题 2014-03-20 FATE 7995 自动年龄估计算法的性能 2015-04-20 FATE 8052 自动性别分类算法的性能 2014-05-21 FRTE 8009 人脸识别算法的性能 2017-03-07 FRTE 8173 FIVE - 视频中的人脸评估:非合作对象的人脸识别 2017-11-23 FRTE 8197 FRPC - 2017 年 IARPA 人脸识别奖挑战赛 2020-01-03 FRTE 草案第 1 部分:验证 2019-09-11 FRTE 8271 第 2 部分:识别 2019-12-11 FRTE 8280 第 3 部分:人口统计影响2020-03-04 FATE 8292 第 4 部分:MORPH - 自动人脸变形检测性能 2020-03-06 FATE 草案第 5 部分:人脸图像质量评估 2020-07-24 FRTE 8311 第 6A 部分:使用新冠疫情前算法的戴口罩人脸识别准确率 2022-01-20 FRTE 8331 第 6B 部分:使用新冠疫情后算法的戴口罩人脸识别准确率 2022-07-13 FRTE 8381 第 7 部分:无纸化旅行和移民的身份证明 2022-09-30 FRTE PDF 第 8 部分:总结人口统计学差异 2022-09-30 FRTE 8439 第 9A 部分:区分人脸的人脸识别验证准确率Twins 2023-09-20 FATE 8491 第 10 部分:基于软件的被动演示攻击检测 (PAD) 算法的性能 2023-09-20 FATE 8485 第 11 部分:人脸图像质量向量评估:特定图像缺陷检测
摘要随着计算机技术的出现,人工智能(AI)有助于放射科医生诊断脑肿瘤(BT)。可以在医疗保健中提高疾病的早期发现导致进一步的治疗,其中典型的AI系统应用在时间和节省的方面发挥了至关重要的作用。磁共振(MR)图像通过图像增强技术增强,以改善对比度和颜色的效果。此外,对于BT的几种类型的MR成像问题,传统方法是无偿的。深度学习技术可以扩展,以帮助克服常规肿瘤检测中遇到的常见问题。因此,在这项工作中,已经提出了基于MR图像的BT检测的即兴Yolov5技术。最终,使用混合网格搜索优化器算法(HGSOA)应用高参数优化(HPO)的想法,以增强拟议深神经网络中超级参数的肿瘤检测性能。为了评估提出的模型的有效性,麦卡洛克的算法rithm用于定位肿瘤区域分割的图像,并且还使用真实注释的图像检查了分割结果。使用MW脑测试图像进行了各种实验,以测量提出的微调模型的准确性。最后,将分类指标与现有的最新技术进行比较,包括MSE,PSNR,SSIM,FSIM和CPU时间,以证明所提出的模型的有效性。在MRI-BT的分类学中,CNN实现了更大的精确性。
脑机接口正在利用细胞外记录中的神经尖峰波形或尖峰时间实现重要的新功能 [1],[2]。尖峰检测是从记录中提取神经尖峰的重要步骤。它不仅可以提取用于神经活动解码的信息,还可以将数据带宽减少数百甚至数千倍,从而实现无线传输并实现完全植入神经接口而无需经皮导线突破皮肤。尖峰检测性能对于保存神经信息和避免解码精度下降至关重要。阈值是尖峰检测的最常用方法,超过阈值的值被视为尖峰。面对不断变化的大脑环境,自适应且稳健的阈值至关重要。文献中提出了许多用于定义阈值的算法。一种方法是使用计算算法 [3],[4],例如短时傅立叶变换、小波变换和模板匹配。还有一些算法方法,例如反馈控制阈值 [5]。最常见的方法是根据信号统计数据设置阈值。噪声统计数据被广泛用于设置阈值。还提出了一种硬件高效估计方法,使用乘数将平均值/中位数/标准差/均方根值设置为阈值 [6]。其他人选择使用稳健统计估计来设置阈值 [7]。将阈值设置为 T = αN ,其中 N 是噪声统计数据,α 是用户定义的参数,这是设置阈值的常用方法 [8]。由于其简单性,这种方法在植入体实施中尤其受欢迎 [9]。然而,这种算法的自适应性
摘要:3D对象检测是自动驾驶和机器人技术的一项具有挑战性且有前途的任务,从LIDAR和相机等多传感器融合中受益匪浅。传感器融合的常规方法依赖于投影矩阵来对齐LiDAR和相机的特征。但是,这些方法通常遭受灵活性和鲁棒性不足,从而在复杂的环境条件下导致对齐精度降低。解决这些挑战,在本文中,我们提出了一个新型的双向注意融合模块,该模块名为Bafusion,该模块有效地使用跨注意力从激光雷达和照相机中融合了信息。与常规方法不同,我们的浮雕模块可以自适应地学习跨模式的注意力,从而使方法更加灵活和健壮。从2D Vision中的高级注意优化技术中汲取灵感,我们开发了集合的线性注意融合层(CFLAF层),并将其集成到我们的小管道中。该层优化了注意机制的计算复杂性,并促进了图像和点云数据之间的高级相互作用,展示了一种新的方法来解决跨模式注意计算的挑战。我们使用各种基线网络(例如Pointpillars,Second和A Part-A 2)在KITTI数据集上评估了我们的方法,并在这些基准线上表现出了3D对象检测性能的一致改进,尤其是对于骑自行车的人和骑行者等较小的对象。我们的方法在Kitti基准测试中取得了竞争成果。
由于大规模的图像对比训练,预训练的视觉语言模型(VLM)(例如剪辑)表现出优越的开放式摄入识别能力。大多数存在的开放式摄制对象检测器都试图利用预训练的VLM来获得生成表示。f-Vit使用预先训练的视觉编码器作为骨干网,并在训练过程中冻结它。但是,冷冻的骨干线不能从标记的数据中受益,以增强表示形式。因此,我们提出了一种新型的两种分支骨干网络设计,称为VIT-FEATURE-调制多规模卷积网络(VMCNET)。vmcnet由可训练的卷积分支,冷冻预训练的VIT分支和特征调制模块组成。可训练的CNN分支可以通过标记的数据进行优化,而冷冻的预训练的VIT分支可以保持大规模预训练的表示能力。然后,提出的特征调制模块可以通过VIT分支的代表来调节多尺度CNN特征。使用拟议的混合结构,检测器更有可能发现新型类别。在两个流行的基准测试中进行了评估,我们的方法提高了新型类别的检测性能,并构成了基线。在OV-Coco上,该提出的方法以VIT-B/16和48.5 AP Novel 50具有VIT-L/14的AP Nove 50实现44.3 AP Novel 50。在OV-LVIS上,具有VIT-B/16和VIT-L/14的VMCNET达到27.8和38.4地图r。
人为错误 (HE) 是核电站 (NPP) 等安全关键型系统的一个重要问题。HE 在核电站的许多事故和停电事件中都发挥了作用。尽管核电站的自动化程度有所提高,但 HE 仍然不可避免。因此,HE 检测的需求与 HE 预防工作同样重要。在核电站中,HE 相当罕见。因此,异常检测是一种广泛用于检测罕见异常实例的机器学习技术,可以重新用于检测潜在的 HE。在本研究中,我们开发了一种基于生成对抗网络 (GAN) 的无监督异常检测技术,以检测核电站中手动收集的监视数据中的异常。更具体地说,我们的 GAN 经过训练可以检测自动记录的传感器数据和手动收集的监视数据之间的不匹配,从而识别可归因于 HE 的异常实例。我们在真实世界数据集和从测试平台获得的外部数据集上测试了我们的 GAN,并将我们的结果与最先进的无监督异常检测算法(包括一类支持向量机和隔离森林)进行了对比。结果表明,所提出的 GAN 提供了改进的异常检测性能。我们的研究对未来基于人工智能的 HE 检测系统的发展大有裨益。© 2022 韩国核学会,由 Elsevier Korea LLC 出版。这是一篇根据 CC BY-NC-ND 许可开放获取的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。
摘要 — 感知和学习算法的进步已使机器人进行人体检测的解决方案越来越成熟,特别是在某些用例中,例如自动驾驶汽车的行人检测或消费者环境中的近距离人体检测。尽管取得了这些进展,但一个简单的问题:哪种传感器-算法组合最适合手头的人体检测任务?仍然很难回答。在本文中,我们通过对机器人技术中常用的传感器-算法组合进行系统的跨模态分析来解决这个问题。我们比较了最先进的人体检测器在具有挑战性的工业用例中对 2D 范围数据、3D 激光雷达和 RGB-D 数据及其选定组合的性能。我们进一步解决了工业目标领域数据稀缺的相关问题,并且最近对 3D 点云中人体检测的研究主要集中在自动驾驶场景上。为了将这些方法上的进步用于机器人应用,我们利用一种简单但有效的多传感器迁移学习策略,通过扩展强大的基于图像的 RGB-D 检测器,以弱 3D 边界框标签的形式为激光雷达检测器提供跨模态监督。我们的结果表明,在检测性能、泛化、帧速率和计算要求方面,不同方法之间存在很大差异。由于我们的用例包含代表广泛服务机器人应用的困难,我们相信这些结果为进一步研究指出了相关的开放挑战,并为从业者设计他们的机器人系统提供了宝贵的支持。
军事活动的重点最近已从大面积交战转向区域冲突。因此,海军海上作战继续向复杂的浅水近岸环境中的沿海战争发展。这种演变需要新的传感器、先进的作战概念和改进的数据分析能力等。在这些恶劣环境区域规划行动很困难,因为准确预测战术传感器性能取决于对当地环境条件的详细了解。因此,战术任务规划很少是最佳或有效的 - 通常导致覆盖范围不足、风险增加和任务成功率降低。美国海军正在探索延长寿命的环境声纳浮标概念,以更好地表征沿海环境。一些设计包含用于测量海洋温度的热敏电阻串和用于测量环境噪声的水听器。这种复杂的声纳浮标比传统的单次测量消耗性深海温度计要昂贵得多,但它可以提供更彻底的环境评估。本文从覆盖面积和检测概率的角度研究了增加的传感器成本与提高的 ASW 性能之间的权衡。对于这种权衡分析,使用了日本海的温度数据以及来自档案数据和噪声统计模型的真实动态环境噪声场。然后模拟了几个虚构的环境浮标在该区域漂流并在几天内收集数据。分析表明,漂流的延长寿命环境声纳浮标场可以显着改善环境表征、战术规划和 ASW 检测性能。
大脑中线移位(MLS)是一种定性和定量的放射学特征,它可以衡量脑中线结构的横向移位,以响应由血肿,肿瘤,脓肿或任何其他占据脑膜内病变引起的质量效应。可以使用其他参数来确定神经外科干预的紧迫性,并预测占据病变的患者的临床结果。然而,由于跨病例的临床相关大脑结构的差异很大,因此精确检测和量化MLS可能具有挑战性。在这项研究中,我们通过使用分类和分割网络架构来研究了由病例级MLS检测以及脑部标记位置的初始定位以及对脑部标记位置的最初定位和完善的级联网络管道。我们使用3D U-NET进行初始定位,然后使用2D U-NET来估计更精确的分辨率的确切地标点。在改进步骤中,我们从多个切片中融合了预测,以计算每个地标的最终位置。,我们用大脑的解剖标记产生的高斯热图目标训练了这两个UNET。案例级别的地面真相标签和地标注释是由多个训练有素的注释者产生的,并由放射学技术人员和放射科医生进行了审查。我们提出的管道实现了使用2,545个头部非对比度计算的测试数据集在AUC中的情况级MLS检测性能
