基于深度学习算法的计算机辅助诊断系统已显示出糖尿病性视网膜病快速诊断(DR)的潜在应用。由于变压器的出色表现而不是自然图像上的卷积神经网络(CNN),因此我们尝试开发一种新模型,以使用变压器使用有限数量的大型视网膜图像来对引用的DR进行分类。在本研究中应用了带有蒙版自动编码器(MAE)的视觉变压器(VIT),以提高参考DR的分类性能。我们收集了超过224×224的100,000张公共底面的视网膜图像,然后使用MAE在这些视网膜图像上进行了预训练的VIT。将预训练的VIT应用于对引用的DR进行分类,还将性能与使用ImageNet的VIT预先训练的性能进行了比较。通过使用MAE进行超过100,000个视网膜图像预先培训,模型分类性能的改善优于预先训练的Ima-Genet。本模型的精度,曲线下的面积,最高灵敏度和最高特异性分别为93.42%,0.9853、0.973和0.9539。本研究表明,MAE可以为输入图像提供更大的灵活性,并大大减少所需图像的数量。同时,这项研究中的预处理数据集量表比ImageNet小得多,并且不需要ImageNet的预训练权重。
如何引用本文:Prem Krishna | Saheel Ahamed | Roshan Kartik “使用 Open CV 和 YOLO 的基于 AI 的 ATM 智能安全系统”发表在《国际科学研究与发展趋势杂志》(ijtsrd)上,ISSN:2456-6470,第 5 卷 | 第 4 期,2021 年 6 月,第 336-338 页,URL:www.ijtsrd.com/papers/ijtsrd41232.pdf 版权所有 © 2021 作者和国际科学研究与发展趋势杂志。这是一篇根据知识共享署名许可条款分发的开放获取文章(CC BY 4.0)(http://creativecommons.org/licenses/by/4.0)介绍众所周知,数字印度是许多创新和技术进步的成果。如今,ATM 中心的监控摄像头仅用于记录目的。如果发生任何盗窃活动,只有通过人类信息才能知道。然后警方将借助闭路电视记录展开调查。在某些情况下,小偷会遮盖或破坏摄像头,使其无法记录。众所周知,世界广泛使用自动视频监控系统,它在我们的日常生活中发挥着至关重要的作用,以加强对个人和基础设施的保护和安全。
贴眼镜的目的:消除双眼图像重叠的视觉部分;这可以减少视觉“背景”噪音。这有助于我们的眼睛独立工作,而不是在受伤后努力协同工作。我们的大脑倾向于关注未对齐的图像重叠部分,从而限制对其他任何事物的有效关注。此外,贴眼镜可以消除我们中央焦点视觉的部分,促进更多地使用空间视觉系统来协助视觉处理。