项目参考号:47S_BE_0366学院:政府工程学院,Doddamannugudde,Ramanagara分支:计算机科学与工程学系:Shabeen Taj G.博士(S)学生:Ritesh R. Ritesh R. Harshith R. Harshith R. Harshith N. J. J. J. J. J. J. M. S. sachin C. S. S. S. S. S. S.
研究工作“与Arduino Nicla Vision嵌入了AI”背景为“技术系统中的Ki”的一部分,将提供许多AI加速的嵌入式板。这包括初始调试,包括必要外围的结构,为为该平台开发AI模型的必要软件环境以及第一个AI应用程序的实现。作为这项工作的一部分,将使用供专业使用的Arduino Nicla Vision(https://docs.arduino.cc/hardware/nicla Vision/)使用。这将在第一个计算机视觉算法中实现。要求
摘要。机器和人类视力(ICMH)的图像压缩近年来引起了人们的关注。现有的ICMH方法受到高训练和存储开销的限制,这是由于特定于任务的网络设计的大量设计。为了解决此问题,在本文中,我们为ICMH(名为Adapt-ICMH)开发了一种新颖的基于轻量级适配器的调整框架,可以更好地平衡任务性能和比特率与减少的开销。We propose a spatial-frequency modulation adapter (SFMA) that simultaneously eliminates non-semantic redundancy with a spatial modulation adapter, and enhances task-relevant frequency com- ponents and suppresses task-irrelevant frequency components with a fre- quency modulation adapter.所提出的适配器是插件播放的,并且与几乎所有现有的学到的图像压缩模型兼容,而不会损害预训练模型的性能。实验表明,适应性ICMH始终在各种机器视觉任务上的现有ICMH框架较少,并且较少的微调参数和降低的计算复杂性。代码将在https://github.com/qingshi9974/eccv2024-adpaticmh上发布。
销售点(POS)是一种计算机化的硬件和软件系统,可用于完成销售交易。在处理总计之前,在常规POS设置中,收银员手动扫描单个产品条形码。此手动程序很费力,通常会导致长期排队和等待时间,尤其是在高峰时段,最终影响了客户体验和保留。这项工作旨在通过计算机视觉方法自动化产品扫描程序,从而加快了销售流程。在马来西亚零售店中发现的常见产品的自定义数据集上训练了一个有效的Yolov4对象检测模型。最初获取了550张图像,并将80:20分为培训和验证组;进一步的增强培训组的大小增加了1,320张图像。以0.0013的学习率进行了10,000个时期的训练。在训练期间,该模型获得了99.19%的地图,平均IOU的87.42%,平均损失为0.40。随后,该模型被部署在运行事务通知程序的低功率单板计算机上。为了评估其性能,使用该系统处理了10种具有随机产品组合的购物车实例。系统通过其视频供稿自动识别和量化了所有产品,并实时生成逐项账单。以0.9置信度阈值固定,系统在所有对象类中产生98%的平均精度。在短短14秒内处理了从产品检测到将逐项账单交付给系统管理员的交易。此POS系统具有与无人商店集成的潜力,可提供无缝的购物体验。
硕士论文30学分计划:会计和财务管理中的硕士课程。专业:金融管理部商业研究部乌普萨拉大学春季学期,提交日期:2024-05-28
该项目是评估应用于微型动力使用者的深度学习技术和计算机视觉技术的潜力的概念证明。 div>主要目的是开发和测试能够自动检测车辆,行人和轻型移动性的用户,估计其与用户的距离,并仅使用RGB摄像机的数据确定其在指定的自行车道中的存在。 div>
情境图(S图)合并了通过同时定位和映射(SLAM)将3D场景图的接近的几何模型合并到多层联合优化因子图中。作为一种优势,S-graph不仅是通过将几何图与一个图中的各种层次组织的语义界面及其拓扑关系相结合,因此更全面的机器人情境意识,还可以改善本地化的性能,并通过Exploit-exploit-exploit-neploit-neploit-opploit-依靠语义信息绘制。在本文中,我们介绍了基于视觉的S-Graphs版本,其中使用传统的视觉猛击(VSLAM)系统用于低级功能跟踪和映射。此外,该框架利用了ducial标记的潜力(可见以及我们最近引入的透明或完全看不见的标记)来编码有关环境及其内部对象的全面信息。标记有助于识别和绘制结构性的语义实体,包括环境中的墙壁和门,在全球参考中具有可靠的姿势,随后与包括走廊和房间在内的高级实体建立了有意义的关联。然而,除了包括语义实体外,还利用了公爵标记物施加的语义和几何约束来提高重建的地图的质量并减少本地化错误。使用腿部机器人收集的实际数据集上的实验结果表明,我们的框架在制作更丰富的多层分层图方面表现出色,并同时增强了机器人姿势精度。
摘要:在每个会话的开始和结束时,出席是每日课堂评估的重要方面。使用传统方法(例如呼叫拨打电话或接管学生的签名)时,管理出勤可能是一项耗时的任务。老师通常会检查它,尽管老师可能会多次错过某人或某些学生的答案。基于面部识别的出勤系统是解决面孔的问题,目的是通过基于高清监视器视频和其他信息技术利用面部识别技术来收集出勤。我们提供了一个实时的面部识别系统,而不是依赖耗时的方法,用于跟踪这项工作中的学生出勤。识别完成后,出席率将立即在数据库中更新,并带有相关信息。许多机构将从这项努力中获得可观的利益。结果,它花费的时间和人为错误的数量被最小化,从而提高了效率。关键字:面部检测,面部识别,出勤,OpenCV。
摘要:随着人工智能和嵌入式硬件开发的发展,对移动机器人的各种自主导航方法的利用变得越来越可行。因此,已经出现了对这些运动方法的鲁棒验证方法的需求。本文介绍了一种依靠计算机视觉的新颖地面真相定位收集方法。在这种方法中,摄像机被定位在上面,以通过计算机视觉技术来检测机器人的位置。与其他传感器的数据同步收集用于检索定位地面真相的图像。通过将摄像机派生的位置视为地面真理,可以进行比较分析以开发,分析和测试不同的机器人探视方法。除了在本文中提出地面真相收集方法外,我们还使用DNN比较使用来自不同传感器的数据作为输入进行探测。结果证明了我们的地面真相收集方法在评估和比较移动机器人的不同探光法方面的功效。这项研究通过提供可靠且多功能的方法来评估和比较探针技术,这对于开发和部署自主机器人系统至关重要,从而为移动机器人技术领域做出了贡献。
本文描述了一种音乐表达的新乐器,该乐器从编织中制作音乐。此接口仅使用针织针,纱线和计算机作为硬件。笔记本电脑上的网络摄像头输入实时捕获玩家编织,定制的maxmsp补丁处理传入的数据流。使用计算机视觉原理检测到运动,以识别表演者针迹的形状,线条和运动。手势然后将表演者的使用映射到合成器,该合成器根据玩家在编织和purl时根据玩家的移动方式产生Music。每个性能都因表演者编织的速度,前者的技术编织风格,针刺上的针迹的种类,性能期间使用的纱线的颜色和纹理以及编织项目的大小。
