人群计数在现实世界中找到直接应用程序,从而使计算效率和性能至关重要。但是,以前的大多数方法都依赖于限制部署的重型主链和复杂的下游体系结构。为了应对这一挑战并实现了人群计数模型的多功能性,我们介绍了两个轻量级模型。这些模型在合并两个不同的骨架的同时保持了相同的下游体系结构:Mobilenet和MobileVit。我们利用辅助融合来从预训练模型(PTM)中提取不同的比例功能,然后随后将这些特征无缝地结合在一起。这种方法赋予我们的模型能够提高性能,同时保持紧凑,高效的设计。通过将我们提出的模型与先前可用的先前最先进的方法(SOTA)方法进行比较,在上海-A-A Shanghaitech-B和UCF-CC-50数据集上,它取得了可比的结果,同时是计算上最有效的模型。最后,我们提出了一项比较研究,这是一项广泛的消融研究,并修剪以显示模型的有效性。
(OCT) 图像,一些研究成功地使用 AI 来检测单一疾病表现的存在,例如视网膜内积液的存在、视网膜黄斑硬化症的存在或黄斑液的量化。2–4 该领域的一种可能的 AI 应用是为居住在缺乏眼科医生或训练有素的验光师的地区患者提供筛查和诊断帮助。然而,现代网络包含数百万个学习到的连接。总的趋势是设计更深、更复杂的网络以实现更高的准确性。这些人工智能程序通常需要高科技和昂贵的计算机系统,其中包含先进的图形处理单元,而这些单元通常是医疗保健不足或低收入地区的公用事业所负担不起的。在这种情况下,基于智能手机的高精度、低设备要求的移动人工智能系统极其重要和有用。智能手机应用程序 (app) 和移动机器人通常只需要较低的内存和能耗。5 因此,开发了一种高效的网络架构 MobileNet,以满足移动和嵌入式视觉应用程序的设计要求。更小更快的模型使用宽度乘数和分辨率乘数,以合理的精度来减少尺寸和延迟。与其他模型相比,使用 MobileNets 的程序表现出优越的尺寸、速度和精度特性。6
摘要:多年来,移动设备市场一直在快速增长,而由于这种趋势,移动恶意软件也变得越来越复杂。研究人员专注于恶意软件检测系统的设计和开发,以加强敏感和私人信息的安全性和完整性。在这种背景下,深度学习得到了利用,也应用于网络安全领域,展示了构建模型以检测应用程序是可信的还是恶意的的能力。最近,随着量子计算的引入,我们见证了量子算法在机器学习中的引入。在本文中,我们比较了五种最先进的卷积神经网络模型(即 AlexNet、MobileNet、EffficientNet、VGG16 和 VGG19)、作者开发的一个网络(称为 Standard-CNN)和两种量子模型(即混合量子模型和全量子神经网络)来对恶意软件进行分类。除了分类之外,我们还通过采用梯度加权类激活映射来突出显示从应用程序获得的图像中具有特定预测症状的区域,以及卷积和量子模型在 Android 恶意软件检测中获得最佳性能,从而提供模型预测背后的可解释性。在由 8446 个 Android 恶意和合法应用程序组成的数据集上进行了真实世界的实验,获得了有趣的结果。
摘要 - 本文介绍了一项有关使用深度学习技术的手写签名验证的全面研究。本研究旨在应对离线签名验证的挑战,在此任务是自动区分真正的签名与伪造的挑战。所提出的方法利用了最新的深度学习模型,包括Mobilenet,Resnet50,InceptionV3和VGG19与Yolov5结合使用,以实现高精度分类和可靠的伪造检测。在多个基准数据集上评估了该系统,包括Kaggle签名,Cedar,ICDAR和SIGCOMP,在各种现实世界中展示了其有效性和鲁棒性。所提出的方法包括数据预处理技术,以增强输入手写签名图像的质量,从而使模型能够捕获基本功能和模式以进行准确的分类。结果表明,与现有的最新方法相比,提出的方法的优越性在识别真正的特征并准确检测伪造方面达到了出色的准确率(89.8%)。此外,该模型对变化数据集大小和配置的适应性进一步支持其在签名验证任务中实际部署的潜力。这项研究有助于脱机签名验证技术的发展,为确保各种应用程序中手写签名的安全性和真实性提供了可靠,有效的解决方案。
摘要 - 脑肿瘤是颅骨内异常质量生长的一般名称,这是由于大脑中细胞续签期间的误差而导致的。从脑肿瘤中丧生的人数每天都在增加。早期诊断对于减少损失的治疗计划和结果至关重要。MRI(磁共振)成像方法广泛用于脑肿瘤诊断并显示大脑中的组织。通过在传统方法中使用MR图像对脑肿瘤进行分类很困难,因为大脑结构及其中的组织很复杂。脑肿瘤分类已被使用,近年来一直很受欢迎并且在分类方面具有很高的准确率。在这项研究中,它的目的是通过比较VGG16,VGG19和MobïLenet深度学习体系结构来确定具有最高精度比率的体系结构。为了增加这些体系结构的成功,将直方图均衡应用于数据库中的图像。所使用的数据集由3590 MR图像组成,由四个脑肿瘤类(神经胶质瘤,脑膜瘤,无肿瘤,垂体)组成。MobileNet由于测试和训练而获得了最高的精度。实验研究表明,直方图均衡通过提高图像质量有助于深度学习结构的性能。关键词:脑肿瘤,图像分类,深度学习
医学史表明,心肌梗塞是人类死亡的重要原因之一。自主技术的快速发展、计算机视觉和边缘计算的兴起为医疗监测系统提供了令人着迷的可能性。这项工作的主要动机是通过环境智能下的自动紧急识别系统提高心脏骤停期间的存活率。我们提出了一种基于胸痛和跌倒姿势的生命体征检测的新方法,使用智能监控摄像头来应对心肌梗塞期间的紧急情况。使用最先进的卷积神经网络实现了来自“边缘 AI”的实时嵌入式解决方案:单次检测器 Inception V2、单次检测器 MobileNet V2 和物联网嵌入式 GPU 平台 NVIDIA 的 Jetson Nano。深度学习算法针对 3000 个室内彩色图像数据集实施:南洋理工大学红蓝绿和深度、NTU RGB + D 数据集和私有 RMS 数据集。研究主要围绕创建和训练 CNN 模型以检测生命体征并评估其性能指标的两个关键因素。我们提出了一种经济高效且功耗低的心肌梗死生命体征机载检测模型,并评估了指标,平均准确率为 76.4%,平均召回率为 80%。
近年来,卷积神经网络(CNN)凭借其出色的特征提取能力在图像识别、工业故障检测、无人驾驶等领域得到了广泛的应用。然而,传统的 CNN 模型 [1, 2, 3] 具有大量的参数,难以部署在资源受限的嵌入式设备上。因此,随着 CNN 的应用需求不断增加,如何简化 CNN 模型并有效地将其部署到嵌入式设备上成为了新的研究热点。使用轻量级 CNN 模型,例如 Xception [4]、MobileNet [5, 6, 7] 和 ShuffleNet [8],是在准确率损失不大的情况下显着减少参数数量的有效方法。此外,使用低比特数据量化方法[9,10,11]可以将32比特数据量化为8比特甚至更低,大大减小了CNN模型的大小。因此,结合这两种方法对轻量级CNN模型进行低比特数据量化,为实现CNN模型提供了一种计算友好的算法解决方案。在各类嵌入式设备中,FPGA在功耗和灵活性之间提供了更好的权衡,成为实现CNN的一种有吸引力的解决方案。然而,轻量级CNN模型包含多种核大小,这对基于FPGA的CNN加速器的设计提出了挑战。大多数现有设计[12,13,14,15,16,17,18,19,20,21]可以有效处理具有某些特定核大小的卷积。然而,
摘要:在现实捕捉技术和人工智能(AI)的进步驱动的驱动到施工站点上,图像分类越来越多地用于自动化项目监视。部署实时应用程序仍然是一个挑战,尤其是在远程施工站点上,由于建筑物内的高信号衰减,电信支持或访问有限。为了解决此问题,本研究提出了一个有效的启用边缘计算的图像分类框架,以支持实时构造AI应用程序。使用Mobilenet转移学习开发了轻量级的二进制图像分类器,然后进行量化过程,以降低模型大小,同时保持准确性。组装了一个完整的Edge计算硬件模块,包括Raspberry Pi,Edge TPU和电池等组件,并将多模式软件模块(包含视觉,文本和音频数据)集成到边缘计算环境中以启用智能图像分类系统。部署了两项涉及材料分类和安全检测的实际案例研究,以证明拟议框架的有效性。结果证明了开发的原型成功同步多模式机制,并在分化材料中达到了零延迟,并识别危险的指甲而没有任何Internet连接。建筑经理可以利用开发的原型来促进集中的管理工作,而不会损害准确性或计算资源的额外投资。这项研究为未来的建筑工作站点启用边缘的“智能”铺平了道路,并促进实时的人类技术互动,而无需高速互联网。
1位城市工程学院CSE助理教授2,3,4,5印度班加罗尔城市工程学院的计算机科学与工程学学生。 摘要:人工智能技术的出现刺激了各个领域的创新,废物管理也不例外。 该项目提出了一个基于AI的垃圾检测系统,旨在彻底改变各种环境中废料的识别和分类。 利用先进的计算机视觉和机器学习算法,该系统自动化垃圾检测和分类过程,从而有助于更高效,更可持续的废物管理实践。 计算机愿景的最新进展已为解决围绕废物管理的全球问题开辟了新的途径。 这项研究深入研究了计算机视觉技术,以进行精确的废物分类和识别。 主要目标是开发一种能够准确识别和分类各种废物容器的强大算法。 使用深度学习算法(例如卷积神经网络(CNN),内容提取和分类)。 数据集包含图像,描绘了各种废物类型,包括塑料,纸张,玻璃,金属和有机废物。拟议的系统涉及预处理,特征提取,分类和后处理阶段。 图像增强,归一化和降噪功能在预处理过程中增强了输入图像质量。 使用预训练的CNN模型(例如Resnet,VGG或Mobilenet)提取相关特征。1位城市工程学院CSE助理教授2,3,4,5印度班加罗尔城市工程学院的计算机科学与工程学学生。摘要:人工智能技术的出现刺激了各个领域的创新,废物管理也不例外。该项目提出了一个基于AI的垃圾检测系统,旨在彻底改变各种环境中废料的识别和分类。利用先进的计算机视觉和机器学习算法,该系统自动化垃圾检测和分类过程,从而有助于更高效,更可持续的废物管理实践。计算机愿景的最新进展已为解决围绕废物管理的全球问题开辟了新的途径。这项研究深入研究了计算机视觉技术,以进行精确的废物分类和识别。主要目标是开发一种能够准确识别和分类各种废物容器的强大算法。使用深度学习算法(例如卷积神经网络(CNN),内容提取和分类)。数据集包含图像,描绘了各种废物类型,包括塑料,纸张,玻璃,金属和有机废物。拟议的系统涉及预处理,特征提取,分类和后处理阶段。图像增强,归一化和降噪功能在预处理过程中增强了输入图像质量。使用预训练的CNN模型(例如Resnet,VGG或Mobilenet)提取相关特征。转移学习技术为垃圾分类任务优化了这些模型。分类涉及使用使用优化算法(如随机梯度下降(SGD)和ADAM)进行标记的数据训练改良的CNN模型。诸如非最大抑制(NMS)之类的后处理技术解决了生产预测并消除重复的信号。实验结果证明了该算法在准确分类和识别废物类型方面的有效性,从而对废物管理工作产生了重大贡献。未来的研究指示包括实时实施,可伸缩性以及与机器人系统的集成,用于工业和城市环境中的自主废物管理。关键字:计算机视觉,CNN模型,Python,Yolo模型,优化铝制。
摘要 恶意软件是一种不断发展和不断上升的威胁,尤其是勒索软件,这是一种恶意软件。勒索软件即服务平台的兴起加剧了这种激增,恶意软件研究人员需要快速可靠地识别勒索软件家族的选项,以保护个人数据和重要基础设施。在本研究中,我们提供了一种基于图像的检测和分类方法,可以通过将勒索软件与已知的勒索软件家族进行比较来帮助研究人员识别勒索软件的来源。我们的目标是使用有限大小的训练数据集和 COTS 硬件对给定的勒索软件样本达到高准确度和低误报率。我们使用了从 VirusTotal (VT) 获得的 347,307 个 Windows 可执行恶意软件样本的数据集。这些样本由 VT 在 2017 年至 2020 年期间收集。从这个数据集中,我们选择了被确认为已知勒索软件的样本。我们应用了一种新颖的 AI 驱动方法,根据二进制文件的图像表示对勒索软件进行分类。安全从业人员和学者已将这种方法用于一般恶意软件,但并未用于勒索软件等特定类型的恶意软件。我们使用了一种简单的方法,根据 Keras(TensorFlow 开源机器学习平台的 Python API)中 16 个可用应用程序来选择性能最佳的卷积神经网络。这些应用程序在 ImageNet 自然图像数据集上进行了预训练。所提出的方法实现了 90% 以上的准确率和高召回率,基于三通道 (RGB) 图像高概率检测勒索软件。我们数据集上得分最高的模型是 MobileNet 和 MobileNetV2。关键词:勒索软件、计算机视觉、深度学习、CNN、机器学习