摘要:这项工作评估了Phoenix Contact的PLCNEXT生态系统的可编程逻辑控制器(PLC)作为图像处理平台。plcnext控制器提供了“经典”工业控制器的功能,但它们基于Linux操作系统,还允许使用通常与计算机关联的软件工具。使用OPENCV库中Python编程语言中的视觉处理应用程序在PLC中使用此功能实现。这项研究的重点是评估该PLC作为图像处理平台的使用,尤其是用于工业机器视觉应用。该方法基于使用标准图像处理算法将PLC与计算机的性能进行比较。此外,还提供了基于现实情况下的示范应用程序,以通过视觉检查进行质量控制。得出的结论是,尽管处理能力有重大限制,但同时将PLC用作工业控制器和图像处理平台对于低复杂性和不符合周期时间的应用是可行的,为对工业自动化和计算机视觉技术的融合感兴趣的科学社区提供了宝贵的见解和基准。
摘要:二维材料有望在下一代电子和光电设备中发挥重要作用。最近,由于其独特的物理特性和潜在的应用,扭曲的双层石墨烯和过渡金属二核苷引起了极大的关注。在这项研究中,我们描述了光学显微镜的使用来收集二硫化钼(MOS 2)的化学蒸气沉积(CVD)的色彩空间,并应用了语义分割卷积神经网络(CNN)的应用,以准确且快速地识别MOS 2 Flakes的厚度。第二个CNN模型经过训练,以在CVD生长的双层薄片的扭曲角度提供精确的预测。该模型利用了一个数据集,该数据集包含10,000多个合成图像,其中包括从六角形到三角形形状的几何形状。通过第二次谐波产生和拉曼光谱执行了对扭曲角度深度学习预测的后续验证。我们的结果引入了一种可扩展的方法,用于自动检查扭曲的原子薄的CVD生长双层。关键字:扭曲角度,过渡金属二核苷(TMD),深度学习,OpenCV,拉曼
在线投票系统中使用面部识别和一次性密码可确保正确的个人投票。最初,该系统采用面部识别来验证选民的面孔是否与之相匹配,从而减少了欺诈活动的可能性。随后,将唯一的一次性密码发送到选民的移动设备,他们必须输入它以确认其身份。将面部识别和OTP相结合的双重验证过程增强了投票系统的安全性和可靠性。Python的机器学习工具的利用促进了该系统的有效开发。Python和机器学习技术可用于基于面部识别和一次性密码认证的安全有效的在线投票系统。该系统利用面部识别算法来验证选民的身份,从而最大程度地减少了冒险和欺诈的风险。通过OTP验证进一步支持它,增加了一层安全层,以确保只有授权的选民参加。Python的机器学习库,包括OpenCV和TensorFlow,用于实现面部识别,而OTP功能可以增强系统的安全性。这种全面的方法促进了适合大规模选举的强大,安全和用户友好的投票过程。
自动驾驶汽车的引入代表了运输历史上的分水岭,并承诺提供更安全,更高效和可访问的流动性。但是,转移到完全无人驾驶汽车的障碍中,包括检测出意外的障碍物,例如从其他车辆突出物体。这项研究试图为自动驾驶汽车创建原型突出检测系统。该原型构建在玩具车底盘上,并具有由微控制器控制的电动机和车轮。一个小型相机,例如网络摄像头或Raspberry Pi相机,记录了车辆的前视图。Raspberry Pi或Arduino用作中央计算单元,解释传感器数据,做出决策并将命令发送到驱动器系统。为了训练检测系统,我们拍摄了带有和没有突起的汽车的照片。这些照片与OpenCV库一起处理,以提高功能质量和检测准确性。基本对象识别技术检测突起,系统检查图像是否差异。系统检测到突出时,它会停止汽车,激活LED警报或发出蜂鸣器。测试原型以确保其有效性,并随着反馈的驱动而变化。该项目提供了计算机视觉和机器人技术的动手经验,这有助于提高自动驾驶汽车安全性的总体目标。
2019 年 12 月,冠状病毒大流行开始。冠状病毒疾病-19 (COVID-19) 通过直接接触直接从受污染的表面传播。为了对抗病毒,需要大量设备。口罩是人多拥挤场所个人防护的重要组成部分。因此,确定一个人是否戴着口罩对于融入当代社会至关重要。为了实现这一目标,本文提出的模型使用了深度学习库和 OpenCV。出于安全考虑,选择了这种方法,因为它在部署期间具有很高的资源效率。分类器是使用 MobileNetV2 结构构建的,该结构设计为轻量级,能够在 NVIDIA Jetson Nano 等嵌入式设备中使用以进行实时口罩识别。模型构建的阶段包括收集、预处理、拆分数据、创建模型、训练模型和应用模型。该系统利用图像处理技术和深度学习来处理实时视频源。当有人没有戴口罩时,输出最终会通过内置蜂鸣器发出警报声。实验结果和测试用于验证系统的性能。包括训练和测试,识别率达到99%。
本项目使用深度学习技术介绍了用于图像着色和文本对图像生成的Web应用程序。应用程序包括两个主要模块:图像着色,将黑白图像转换为颜色,以及文本到图像生成,该图像基于文本描述创建图像。用于图像着色,预先训练的深度神经网络模型可用于预测灰度图像的色彩信息。该模型是使用OpenCV的DNN模块实现的,并且能够准确恢复颜色为灰度图像。在文本到图像生成模块中,采用稳定的扩散管道来生成文本提示中的图像。本管道利用深度学习技术根据用户提供的文本描述来合成图像。Web应用程序提供了一个用户友好的接口,供用户上传图像以进行着色和输入文本提示以生成图像。处理后,应用程序将有色的图像或生成的图像返回给用户。总体而言,该项目展示了深度学习模型在增强视觉内容创建方面的潜力,并为用户提供了一种实用的应用程序,可以交互探索图像着色和文本驱动的图像生成。
在网络技术中的可变范围内推进,开发了许多新技术。安全问题很重要,尤其是在使用诸如面部细节之类的可变方法的人们检测和识别中。最近几天已广泛使用传感器来支持安全系统。传感器是用于将任何类型的信号转换为电信号的设备,这些信号将在以后进行处理。这些信号可以由用户以多种方式查看。传感器在开发阶段增加了,该开发阶段可以与操作系统,数据存储系统,处理单元,通信单元和任何其他功能单元集成在一起。检测和识别系统被发展为新的技术水平。某些系统(例如图形印刷和棕榈线)面临许多问题,因为皮肤结构可能会及时面对。因此,这些方法面临着一定的问题和局限性,使他们更准确地搜索其他方法。此搜索旨在根据传感器创建一种新方法来进行面部检测和识别。用于面部识别的大多数方法取决于OPENCV库,这些库具有良好的准确性和时间恢复可用性。另一方面,开发了实际应用,以提高这些系统(例如Seetaface和Youtu方法)的准确性。也要检测到三种检测方法很重要,以提高整个系统的准确性,即侧面检测,遮挡检测和面部表情。然后将这些数据进行比较,以创建系统的全部精度结果。
该项目提出了一种使用人工智能和物联网技术的微笑激活自动售货机。交互式电子产品市场正在稳步增长。为了确保这一点,我们试图将人工智能与自动售货机关联起来,用户的微笑会使用物联网技术触发自动售货机的输出。我们项目的主要目标是将新的技术应用引入社会,并在购买巧克力时传播微笑,因为我们知道微笑是我们灵魂幸福的使者。截至目前,世界上大多数人都日益感到沮丧。使用响应微笑的自动售货机对环境有益,它可以帮助顾客订购巧克力,并让顾客微笑。他们只需选择他们想要的巧克力类型,然后按下订购巧克力按钮。在将巧克力倒入机器之前,会持续监测配料的数量。相关部门会收到通知警告,并被指示填充适当的配料。它旨在改善巧克力自动售货机的整体管理,该机器以前采用投币系统运行。这些设备可以以多种方式构建,但该项目使用了 Arduino 微控制器、开放计算机视觉(OpenCV)的 Python 库和用于微笑检测的 TensorFlow。
摘要:所有年龄段的人都可以从瑜伽的身心健康中受益。瑜伽姿势必须正确执行,尤其是在没有教练的情况下,以免对骨骼、肌肉和韧带造成伤害。因此,在图像处理的帮助下,使用人工智能和机器学习将有助于在没有现场教练的情况下向表演者提供反馈。所提出的系统旨在指导用户正确地执行瑜伽姿势,并在他们做错时纠正他们。以文本和音频的形式向用户提供反馈,这可以帮助练习者防止受伤,并增加练习瑜伽姿势的好处。通过从互联网上拍摄各种图像来创建不同瑜伽姿势的数据集。借助 OpenCV 和媒体管道,从网络摄像头的每个图像中找出数据点。现在将其加载到基于卷积神经网络的深度学习模型 (CNN) 中,该模型有助于识别姿势中的错误并产生错误百分比,并以文本或音频期望输出的形式向用户提供所需的反馈,其分类准确率约为 95%。关键词:实时姿势识别、瑜伽、活动识别、媒体管道和人体姿势估计
计算机工程系D Y Patil工程学院,印度浦那,浦那摘要:在教育和演示环境中有效的沟通在很大程度上依赖于观众参与。为了解决这个问题,我们提出了一个新型的实时受众参与监控系统,该系统利用计算机视觉和实时数据分析技术。该系统采用多步骤的过程,从面部检测和面部地标检测开始,以识别受众成员并分析其头部运动。利用OpenCV和MediaPipe库,该系统估算了受众成员的头部的姿势,从而可以根据头部运动和面部方向来计算注意力评分。然后,使用socket.io实时将这些注意力分数实时流式传输到node.js/express.js服务器,该服务器是数据分发的中心枢纽。服务器将注意力分数传播到多个仪表板应用程序,在此过程中,演讲者和教育工作者可以在整个会话中监视受众的参与度。这项研究提出了一种全面的方法,可以在实时评估和增强受众的参与度,从而为改善沟通和学习成果提供了宝贵的见解。关键字:受众参与,实时监控,计算机视觉,头姿势估计,socket.io,node.js,express.js,仪表板应用程序,教育技术。