摘要。在本文中,我们提出了一个完整的框架,即水星,该框架结合了计算机视觉和深度学习算法,以在驾驶活动期间不断地与驾驶员持续了解。拟议的解决方案符合具有挑战性的汽车环境所施加的要求:光线不变,以便使系统能够工作,无论一天中的时间和天气状况如何。因此,基于红外的图像,即深度图(每个像素对应于传感器和场景中的那个点之间的距离)与传统强度图像相结合。第二,由于在驾驶活动中不得阻止驾驶员的运动,因此需要系统的非侵入性:在这种情况下,使用凸轮和基于视觉的算法是最好的解决方案之一。最后,需要实时性能,因为监测系统必须在检测到潜在危险的情况后立即做出反应。关键字:驱动程序监视·人类互动·计算机视觉·深度学习·卷积神经网络·深度图
项目参考号:47S_BE_0366学院:政府工程学院,Doddamannugudde,Ramanagara分支:计算机科学与工程学系:Shabeen Taj G.博士(S)学生:Ritesh R. Ritesh R. Harshith R. Harshith R. Harshith N. J. J. J. J. J. J. M. S. sachin C. S. S. S. S. S. S.
硕士论文30学分计划:会计和财务管理中的硕士课程。专业:金融管理部商业研究部乌普萨拉大学春季学期,提交日期:2024-05-28
摘要:在每个会话的开始和结束时,出席是每日课堂评估的重要方面。使用传统方法(例如呼叫拨打电话或接管学生的签名)时,管理出勤可能是一项耗时的任务。老师通常会检查它,尽管老师可能会多次错过某人或某些学生的答案。基于面部识别的出勤系统是解决面孔的问题,目的是通过基于高清监视器视频和其他信息技术利用面部识别技术来收集出勤。我们提供了一个实时的面部识别系统,而不是依赖耗时的方法,用于跟踪这项工作中的学生出勤。识别完成后,出席率将立即在数据库中更新,并带有相关信息。许多机构将从这项努力中获得可观的利益。结果,它花费的时间和人为错误的数量被最小化,从而提高了效率。关键字:面部检测,面部识别,出勤,OpenCV。
最近,Visual Transformer(VIT)及其以下作品放弃了卷积,并利用了自我发项操作,比CNN获得了可比甚至更高的精度。最近,MLP-Mixer放弃了卷积和自我发项操作,提出了仅包含MLP层的体系结构。为了实现交叉补丁通信,除了通道混合MLP外,它还设计了其他令牌MLP。在诸如JFT-300M之类的极限数据集上进行训练时,它会取得令人鼓舞的结果。,但是当在ImagEnet-1k等中等规模的数据集上训练时,它的表现不如其CNN和VIT对应。MLP混合使用的性能下降激励我们重新考虑令牌混合MLP。我们发现,MLP混合中的令牌混合操作是深度卷积的变体,具有全局接收场和空间特异性配置。在本文中,我们提出了一种新颖的纯MLP体系结构,即空间移位MLP(S 2 -MLP)。不同于MLP混合器,我们的S 2 -MLP仅包含通道混合MLP。我们设计了一个空间换档操作,以实现通过补丁之间的通信。它具有局部接收场,是空间的 - 不可知论。同时,它无参数且有效地计算。在Imagenet-1K数据集训练时,提出的S 2 -MLP比MLP混合剂具有更高的识别精度。同时,S 2 -MLP在ImageNet-1k数据集上具有出色的性能,具有更简单的架构,较少的失败和参数。
摘要 - 登陆阶段是澳大利亚航空登陆的关键阶段,尤其是当航空站降落在移动平台上的时,作为地面车辆。在本文中,将无人机板上摄像头的信息与观察者组合在一起的解决方案用于估计和预测着陆平台的未来位置。此着陆估计用于基于四局的控制算法,用于产生和跟踪着陆轨迹。然后在实时实验(两种情况)中验证所提出的解决方案,以证明闭环系统的良好性能和效率。本文报告了这些实验的主要图。此外,由于这项工作旨在为将来的发展奠定基础,因此在上一节中讨论了这项工作的现有限制。
摘要:2020 年,美国报告了 10,000 多起鸟击事件,平均每年修复费用超过 2 亿美元,全球修复费用上升至 12 亿美元。鸟类与飞机的碰撞对人类安全和野生动物构成了重大威胁。本文介绍了一种专用于监控机场上空空间的系统,用于定位和识别移动物体。该解决方案是一种基于立体视觉的实时鸟类保护系统,它使用物联网和分布式计算概念以及先进的 HMI 来提供设置的灵活性和可用性。为了实现高度定制,提出了一种具有自由定向光轴的改进型立体视觉系统。为了为中小型机场提供可负担得起的市场定制解决方案,采用了用户驱动的设计方法。数学模型在 MATLAB 中实现和优化。在真实环境中验证了实施的系统原型。使用带有 GPS 记录器的固定翼无人机对系统性能进行定量验证。得到的结果证明了该系统实时检测和尺寸分类的高效性以及高度的定位确定性。
由于无人机系统精密且昂贵,测试期间存在财产损失风险以及政府法规,因此设计和测试无人机的控制算法非常困难。这需要对控制器进行大量模拟以确保稳定性和性能。但是,模拟无法捕捉飞行控制的所有方面,例如传感器噪声和执行器滞后。出于这些原因,使用硬件在环仿真 (HILS) 平台。本文介绍了一种用于无人机视觉控制的新型 HILS 平台。该 HILS 平台由虚拟现实软件组成,可生成投射到屏幕上并通过摄像头查看的逼真场景。飞行硬件包括一架无人机,其机载自动驾驶仪与虚拟现实软件接口。该无人机可安装在风洞中,通过伺服翼型来调节姿态。� 2009 Elsevier Ltd. 保留所有权利。
摘要。传统的单对象跟踪任务正在经历新的转型浪潮,尤其是随着语义缺乏的出现,这导致了视觉跟踪任务的兴起。但是,将Vi-Sual Tracker与自然语言描述相结合的先前方法倾向于依靠文本描述的全局表示,而较少考虑文本描述和Vi-Sual外观之间的精细连接。本文提议利用双向交叉注意模块来捕获语言和视觉特征之间的连接,这些连接进一步投影为密集的语义反映以保持对齐方式。为了保持搜索区域与耦合的自然语言之间的语义同意,并使融合功能保持一致,本文提出了一种新颖的密集性对比度学习损失,以弥合文本和视觉方式之间的语义差距,并以密集的形式对齐。所提出的框架在跟踪包含自然语言描述的数据集(例如TNL2K和OTB99-LANG)方面实现了有希望的结果。我们的方法提供了一种新颖的解决方案,用于代表和对齐单个对象跟踪任务的跨模式信息,并可能激发该领域的进一步研究。
摘要 — 飞机检查的可靠性对飞行安全至关重要。飞机结构的持续适航性很大程度上取决于经过培训的检查人员对小缺陷的目视检测,这些检查任务昂贵、关键且耗时。为此,无人机 (UAV) 可用于自主检查,只要能够在绕目标飞行时定位目标并纠正位置即可。这项工作提出了一种解决方案,用于在近距离自主绕机身飞行以进行目视检查任务时检测飞机相对于无人机位置的姿态。该系统的工作原理是处理来自机载 RGB 相机的图像,将传入的帧与已知机身表面位置的自然地标数据库进行比较。该解决方案已在真实的无人机飞行场景中进行了测试,显示出其在高精度定位姿态方面的有效性。所提出方法的优势具有工业意义,因为我们消除了现有技术解决方案中存在的许多限制。索引词——视觉检查,自我定位,3D姿态,地标检测