边缘计算为自主性和人工智能的发展提供了令人着迷的可能性。自主技术的进步和计算机视觉的复兴导致对快速可靠的深度学习应用程序的需求增加。近年来,业界推出了具有强大处理能力的设备来执行各种物体检测任务。然而,对于实时检测,设备的内存、计算能力和功率受到限制,这可能会影响整体性能。这可以通过优化物体检测器或修改图像来解决。在本文中,我们研究了在应用不同图像压缩技术时基于 CNN 的物体检测器在受限设备上的性能。我们研究了 NVIDIA Jetson Nano 的功能;这是一款低功耗、高性能的计算机,带有集成的 GPU,小到可以安装在 CubeSat 上。我们仔细研究了在 DOTA(用于空中图像中物体检测的大规模数据集)上预先训练的单次多框检测器 (SSD) 和基于区域的完全卷积网络 (R-FCN)。性能以推理时间、内存消耗和准确性来衡量。通过应用图像压缩技术,我们能够优化性能。所应用的两种技术,无损压缩和图像缩放,提高了速度和内存消耗,而准确性没有或几乎没有变化。图像缩放技术实现了 100% 可运行的数据集,我们建议结合这两种技术以优化速度/内存/准确性权衡。
摘要 - 自主在现实世界环境中进行自主导航,搜索和救援操作的特殊性,无人驾驶飞机(UAVS)需要全面的地图以确保安全。但是,普遍的度量图通常缺乏对整体场景理解至关重要的语义信息。在本文中,我们提出了一个系统来构建一个概率度量图,并富含从RGB-D图像中从环境中提取的对象信息。我们的方法结合了前端的最先进的Yolov8对象检测框架和后端的2D SLAM方法 - 制图师。为了有效跟踪从前端接口提取的语义对象类别类别,我们采用了创新的bot-sort方法。引入了一种新颖的关联方法来提取对象的位置,然后用度量图将其投影。与以前的研究不同,我们的方法在具有各种空心底部对象的环境中可靠地导航。我们系统的输出是概率图,它通过合并特定于对象的属性,包括类别的差异,准确定位和对象高度来显着增强地图的表示形式。已经进行了许多实验来评估我们提出的方法。结果表明,机器人可以有效地产生包含多个对象(尤其是椅子和桌子)的增强语义图。此外,在嵌入式计算机-Jetson Xavier AGX单元中评估我们的系统,以在现实世界应用中演示用例。索引项 - 语义映射,无人机,ROS,度量图。
摘要 - 优化人工神经网络的计算效率对于资源受限的平台(例如自主驾驶系统)至关重要。为了应对这一挑战,我们提出了一个轻巧的上下文感知网络(LCNET),该网络加速了语义细分,同时在本文中保持了推理速度和细分精度之间的有利权衡。提出的LCNET引入了部分通道转换(PCT)策略,以最大程度地减少基本单元的计算潜伏期和硬件要求。在PCT块中,三个分支的上下文聚合(TCA)模块扩展了功能接收场,从而捕获多尺度上下文信息。此外,双重注意引导的解码器(DD)恢复了空间细节并增强了像素预测的认可。在三个基准上进行的广泛实验证明了拟议的LCNET模型的有效性和效率。值得注意的是,一个较小的LCNET 3_7仅获得了73.8%MIOU,只有51万个参数,分别使用单个RTX 3090 GPU和Jetson Xavier NX,其令人印象深刻的推理速度约为142.5 fps和〜9 fps。更准确的LCNET 3_11版本可以在约117 fps的推理速度下以相同的分辨率达到75.8%MIOU,在城市景观上约为117 fps推理速度。可以在较小的图像分辨率下实现更快的推理速度。LCNET在移动应用程序方案 - iOS的计算效率和预测能力之间取得了巨大的平衡。代码可在https://github.com/lztjy/lcnet上找到。
摘要 发现和分类脑肿瘤是医学图像分析的重要组成部分,需要先进的深度学习方法和优化算法。认识到脑肿瘤诊断迫切需要准确的方法,我们提出了一种综合方法,整合了包括数据预处理在内的各个阶段。在这个预处理阶段,我们采用长宽比归一化和调整大小等技术来形成标准化数据集。通过标准化图像尺寸,我们旨在改进后续过程,如特征提取和分割,减少潜在的扭曲。建议的模型是使用卷积神经网络 (CNN) 来寻找使肿瘤和非肿瘤区域彼此不同的模式和特征。为了克服下采样过程中的复杂部分和精细纹理,提出的模型与 U-Net 架构混合,可提供 98% 的准确和稳健结果。此外,使用交并比 (IOU) 来测量 Dice 系数,以确保它是否对类别不平衡具有鲁棒性。这显示了一个直观的解释,0.83 和 0.9 的较高值表示强大且更好的分割性能。该模型使用 VGG-16 进一步开发,以对肿瘤等级进行分类。在准确分割肿瘤等级方面,从分割的肿瘤照片中得出的相关特征提供了 73% 的满意度。为了克服复杂性和过度拟合问题,蝴蝶优化算法与 VGG-16 混合,从而在等级分类中提供增强的输出。所提出的模型在肿瘤和非肿瘤识别和分类方面优于其他机器学习 (ML) 和深度学习 (DL) 方法,准确率为 99.99%。为了进一步评估所建议模型的性能、移动性和能源经济性,它还在 JETSON Orin 硬件中实现。
12 年前,当 COLE Publishing 收购了刚刚起步的《便携式卫生间操作员》杂志时,经营一家小企业的方式就大不相同了。2004 年 10 月,当 COLE 的第一期杂志邮寄发行时,iPhone 还只是史蒂夫·乔布斯眼中的一道闪光。在真空吸尘器中安装平板电脑来指挥司机、控制发票和与办公室沟通的想法仍然是乔治·杰森的领域。而 PRO 的主要营销形式是昂贵的电话簿广告。谁能想到过去十年来客户关注点的变化?少数几个主要的户外音乐会场馆已经演变成每个主要市场的大型节日。Bonnaroo、Lollapalooza、Glastonbury、Coachella、TomorrowWorld 和无数的乡村音乐露营节提高了提供特殊活动服务的标准。每个活动都需要数百个便携式卫生间、VIP 卫生间和淋浴拖车选项以及全天候服务。建筑工程也发生了变化。越来越多的市政当局要求在每个建筑工地都配备卫生间。密封托盘、固定桩和其他放置规则正在不断增加,服务频率和质量也受到更严格的审查。多久之后,冲水装置和热水水槽才会像今天其他一些国家一样成为全美的必备品?我记得在担任 PRO 编辑的最初几个月和几年里,承包商会说双向无线电是高科技,只有少数企业是
摘要 —COVID-19 期间的居家令有助于拉平曲线,但具有讽刺意味的是,它却引发了物质使用障碍患者的心理健康问题。使用现成的消费级可穿戴设备(如智能手表)测量大脑中的电活动信号并将其实时映射到潜在的情绪、行为和情绪变化,在假设心理健康异常方面发挥着重要作用。在这项工作中,我们建议实现一种可穿戴的设备心理异常检测 (OMAD) 系统,以检测导致心理健康问题的异常行为和活动,并帮助临床医生设计有效的干预策略。我们提出了一种基于脑电图 (EEG) 信号的内在伪影去除模型,以更好地关联细粒度的行为变化。我们在伪影去除和活动识别(主要)模块上设计了模型压缩技术。我们在卷积神经网络和多层感知器上实现了基于幅度的权重剪枝技术,以在 Nvidia Jetson Nano 上使用推理阶段;可穿戴设备中最受资源限制的设备之一。我们尝试了三种不同的特征提取和伪影去除方法组合。我们使用对照组和治疗组(酒精组)的 EEG 数据,针对不同的物体识别任务,评估了 OMAD 在未剪枝和压缩模型的准确度、F1 分数、内存使用率和运行时间方面的性能。我们的伪影去除模型和主要活动检测模型分别实现了约 ≈ 93% 和 90% 的准确度,模型大小(70%)和推理时间(31%)显著减少。索引术语 — 物质使用障碍、精神异常检测、EEG 伪影、权重剪枝、资源受限设备。
在精确的牲畜种植中,牛的个体识别对于为赋予动物福利,健康和生产力做出的决定提供了至关重要的。在文字中,存在可以读取耳罩的模型;但是,它们不容易携带到现实世界中的牛生产环境,并主要在静止图像上做出预测。我们提出了一个基于视频的牛耳牌阅读系统,称为deRmycow,该系统利用视频中的节奏特性来准确检测,跟踪和读取边缘设备上25 fps的牛耳标。对于视频中的每个帧,ReDmycow在两个步骤中发挥作用。1)标签检测:Yolov5s对象检测模型和NVIDIA DEEPSTREAM跟踪层检测并跟踪存在的标签。2)标签读数:小说whentoread mod-ule决定是读取每个标签,使用trba场景文本识别模型或使用从前框架上读取的读数。该系统是在边缘设备上实现的,即NVIDIA JETSON AGX ORIN或XAVIER,使其可移植到没有外部计算资源的牛生产环境中。要达到实时速度,请阅读 - MyCow仅在当前框架中读取检测到的标签,如果它认为在当前框架中明显改善决策时,它将获得更好的读数。理想情况下,这意味着即使标签被遮挡或模糊,也可以在视频中找到标签的最佳读数并存储在视频中。在真正的中西部奶牛场住房测试该系统时,9,000头母牛,雷米科(Demmycow)系统准确地阅读了96.1%的印刷耳廓,并证明了其现实世界中的商业潜力。devmycow为商业牛农场提供了知情的数据驱动决策流程的机会。
•具有Excelitas的X-Cite Xylis™II宽光谱LED照明系统的显微镜演示,用于常规和高级荧光成像应用的ARC灯更换,以及带有反向添加图像传感器的PCO.Edge 10 Bi Clhs摄像头,可提供多达85%的量子效率,可提供高达85%的宽度光谱。•多光谱技术,包括PCO.pixelfly™1.3 SWIR高性能机器摄像机,带有Ingaas图像传感器,在短波红外(SWIR)中敏感,近红外且可见的电磁谱系范围;除了具有模块化设计和无限校正光学的Optem®融合微成像系统,可在机器视觉,自动化光学检查和非接触式计量方面的最大多功能性。•光学相干断层扫描(OCT)演示展示了Excelitas的Axsun高速SS-OCT可调激光发动机的调音带宽,输出功率,扫描速度和连贯性长度,从而在下一代OCT系统中削减性能。Excelitas Photonics West Booth的其他演示将包括:•使用Excelitas'PCO.Edge®26CLHS SCMOS摄像机和NewLinos®Inspec.xInspec.x 5.6/105 Vis-nir镜头进行自动排序。此演示提供了由基于AI的图像处理驱动的快速响应分类,使用NVIDIA JETSON板,在图像数据流中•使用Excelitas的新PCO.DIMAX 3.6 ST高速相机和Linos D.Fine HR-M系列镜头在高速分析,分析和检查应用程序中使用高速对象识别。•固态激光雷达演示展示了带有单片4通道芯片的自定义16通道脉冲激光模块。低功率digipyro家族可以是ASIC集成驱动程序的芯片具有Excelitas高功率激光器(50 a的150 W /通道)的功能,以及CMOS SPAD(单个Photon Avalanche二极管)阵列,用于LIDAR系统应用。•具有Excelitas低功率Digipyro PYD 1598的实时运动检测演示,以1.8V供应电压为新的行业领先标准,供应电流大大降低。
摘要:在这项工作中,我们提出了对辅助机器人平台技术验证的首次研究,该平台旨在帮助患有神经发育障碍的人。该平台名为 LOLA2,配备了基于人工智能的应用程序,以强化神经发育问题患者的日常生活活动学习。LOLA2 已集成基于 ROS 的导航系统和用户界面,供医疗保健专业人员及其患者与其交互。从技术上讲,我们已经能够将所有这些模块嵌入到 NVIDIA Jetson Xavier 板以及用于在线动作检测 (OAD) 的人工智能代理中。这种 OAD 方法提供了有关用户正在学习或强化的一组日常生活活动的表现程度的详细报告。与患有神经发育障碍的用户合作的所有人机交互过程都是由多学科团队设计的。其主要功能包括能够使用操纵杆控制机器人、图形用户界面应用程序(显示包含强化或学习活动的视频教程)以及监控用户完成任务的进度的能力。辅助机器人平台 LOLA2 的主要目标是提供一个系统,使治疗师能够跟踪用户对日常任务的理解和执行情况。本文重点介绍所提议平台的技术验证及其应用。为此,我们在相应治疗人员的监督下对四名患有神经发育问题和特殊身体状况的用户进行了一系列测试。我们向最终用户展示了所有干预措施的详细结果,分析了所提议技术的可用性、有效性和局限性。在对真实用户进行初步技术验证期间,LOLA2 能够高精度地检测残障用户的动作。它能够高精度地区分四种指定的日常动作,但由于用户的身体限制,某些动作更具挑战性。总体而言,机器人在治疗过程中的出现得到了医疗专业人员和患者的良好反馈。总体而言,这项研究表明,我们开发的机器人能够协助和监测神经发育障碍患者执行日常生活任务。
关于FDP:有关人工智能(AI)的教师发展计划(FDP),用于计算机视觉,医学成像应用将帮助教育者和研究人员了解AI基础知识及其如何应用于具有多个安全应用的医学成像技术。参与者将探索机器学习和深度学习概念,专注于使用AI进行医学成像,这有助于诊断,医疗保健,农业,零售和监视系统。AI通过基于面部识别,虹膜识别,指纹分析和语音识别的准确有效的身份验证方法,在计算机视觉中起关键作用。通过实践活动和实例实例,与会者将获得实用技能,可以在教学和研究中有效地使用不同的AI使用AI。在计划结束时,参与者将准备将AI工具集成到他们的工作中,提高他们通过现代技术教授和解决安全挑战的能力。这将通过增强他们在这些关键领域的专业知识和教学能力来使参与者受益。主要课程内容:针对计算机视觉应用程序的最新实施介绍。机器学习基础知识,使用数据预处理和数据可视化。监督和无监督的学习方法,SVM分类,神经网络和应用程序。深度学习方法的简介和基于DL的其他架构及其应用程序。用于计算机视觉,生物特征和医学成像实现的深度学习体系结构。使用Python/Matlab的动手会话。医学图像数据处理和分析。用于生物医学成像,基于CT扫描/MRI的图像分析,眼底和医学图像分类的AI/ML。对象检测/跟踪算法(例如Yolo等),诸如UNET等分段算法等使用张量流/Pytorch识别人类活动/动作/生物识别识别张量流/keras/pytorch/jupyter和colab的基础知识。使用Python/Matlab使用数据预处理和数据可视化。CV和AI算法在硬件平台上实现,例如Jetson Nano,TX2和Pynq等。主持此计划的教师:该计划将由Nit Warangal的教职员工进行;邀请来自IIT/NIT/IIIT的有关领域的院士在该计划中发表讲座。也有望作为课程的一部分提供行业的演讲者。