I.简介 失明是世界上最常见的残疾之一。在过去的几十年里,因自然原因或事故而失明的人数有所增加。部分失明的人视力模糊,只能看到阴影,夜视能力差或视野狭窄。另一方面,完全失明的人没有视力。根据世界卫生组织的数据,全世界约有 22 亿视障人士或盲人 [1]。盲人传统上使用白手杖帮助他们在周围环境中导航,尽管这种方法无法提供远处移动障碍物的信息。此外,白手杖无法识别膝盖以上较高的障碍物。另一种帮助盲人的方法是使用经过训练的导盲犬。另一方面,经过训练的狗价格昂贵且难以获得。最近的研究 [2]-[9] 提出了几种可穿戴或手持电子旅行辅助设备 (ETA)。这些小工具中的大多数都包括各种传感器,可以绘制环境地图并通过耳机提供语音或声音警报。这些设备的可靠性受实时听觉信号质量的影响。许多当代 ETA 缺乏实时阅读辅助,用户界面差、成本高、便携性有限且没有免提访问。因此,这些小工具并不受盲人的欢迎,它们需要在设计、性能和可靠性方面进行改进,以便在室内和室外环境中使用。
在当今技术计算机化的世界,视力障碍人士面临着社会对抗的主要问题,他们认识到需要自力更生。他们在陌生的环境中苦苦挣扎,没有任何人工帮助。光学信息是大多数任务的基础,因此视力障碍人士处于不利地位,因为无法获得有关周围环境的必要信息。借助最新技术,可以为视力障碍人士提供支持。该项目旨在利用人工智能、机器学习、图像和文本识别来帮助那些失明或视力受损的人。这个想法通过移动应用程序体现出来,该应用程序明确专注于语音助手、图像识别、货币识别等。该应用程序还能够帮助用户使用语音命令识别日常生活中的物体,进行文本分析以识别硬拷贝文档中的文本。这将是视力障碍人士在技术的帮助下与世界联系并利用技术潜力的有效方式。
第二部分仍然保密,详细介绍了涉及Feedgy的PV温室试点系统的现实应用程序。本节提供了配备辐照传感器的实验设置。分析了自2024年2月以来收集的数据,以了解温室内的辐照行为。开发了一种基本的辐照模型,称为组成模型。该模型使用简化的光学,物理和几何系数结合了用于扩散辐照度的光学VF模型与直接辐照模型。模型验证和对实验数据的分析表明,该模型可以有效地执行,尤其是在阴天天数,显示内部和外部辐照行为之间的线性相关性很强。尽管具有简单性和效率,但由于试验系统和数据质量的限制,该模型仍存在局限性。尽管如此,它为APV市场中目前普遍存在的更复杂和计算密集的方法提供了一种有希望的替代方法。
在当今充斥着欺骗和其他欺诈行为的世界里,人们发现生活非常困难。对于盲人或视力有障碍的人来说,情况更糟。他们在日常生活中面临着更多的挑战,特别是在处理货币和其他与金钱有关的问题时。为了帮助盲人,我们正在开发一个项目,帮助他们识别货币的面额,因为钞票上没有盲文标记。伪钞或假钞是另一项难以识别的任务,无论是对健康人还是盲人而言。因此,除此之外,我们还加入了假钞检测系统,帮助每个公民避免被骗。关键词:假钞检测、货币识别、VGG16、盲人、CNN、图像处理。介绍机器学习是一种人工智能能力,它奖励编程应用程序在预测结果时更加谨慎,而无需进行明确修改。ML 计算利用明显的信息作为预期新收益的义务。在神经网络中,卷积神经网络 (ConvNets 或 CNN) 是进行图像分类、图像分析和图像处理的主要方法之一。图像识别、面部识别等是 CNN 广泛应用的领域之一。
视障人士在从事与环境、社会和技术相关的活动时遇到困难。此外,他们在日常生活中也难以独立和安全。本研究提出了基于深度学习的视觉对象识别模型,以帮助视障人士使用安卓应用平台进行日常生活。本研究主要关注金钱、衣服和其他基本物品的识别,以使他们的生活更轻松。基于卷积神经网络 (CNN) 的视觉识别模型由 TensorFlow 对象应用程序编程接口 (API) 开发,该模型使用单次检测器 (SSD) 和来自 Mobile V2 的预训练模型,是在 Google 数据集上开发的。视障人士捕捉图像,并将其与预加载的图像数据集进行比较以进行数据集识别。带有图像名称的口头信息将让盲人知道捕捉到的图像。物体识别实现了高精度,无需使用互联网连接即可使用。视障人士尤其从这项研究中受益匪浅。
摘要:本文介绍了一款由人工智能 (AI) 技术支持的创新移动应用程序,旨在显著改善视障人士的日常生活。该应用程序集成了对象识别、颜色识别、离线功能、纸币识别、条形码读取、文本阅读器等高级功能。这些功能共同为用户提供了有关其周围环境的实时信息,促进了安全和独立,实现了安全的金融交易,并增强了整体可访问性。人工智能算法的集成确保了准确高效的性能,使该应用程序成为改善生活质量和促进视障人士包容性的宝贵工具。这项研究展示了人工智能驱动的解决方案在解决可访问性挑战和培养不同用户群体独立性方面的潜力,为辅助技术领域做出了贡献。关键词:- 人工智能、移动应用、可访问性、辅助技术、颜色识别、离线功能、对象识别、纸币识别、条形码阅读器、文本阅读器、基于语音的导航。
基于特征提取的盲人物体识别 [4]。SIFT(尺度不变特征)算法被提出来实现该解决方案。它不需要任何形式的图像转换。进行预处理以消除噪声和不均匀照明造成的挑战。然后借助局部特征提取方法找出兴趣点,并为其计算特征或向量和描述符。该算法有助于将图像表示为图像的兴趣点集合,这些图像对图像变换不变且对照明变化有部分影响。它克服了以前实现 RGB 到 HSI 转换的缺点,因为图像的复杂性不会影响性能。但是,所使用的算法是闭源的,很难在不同设备上实现。
方法 % 至论文参考。到论文 SLAM 16.7 [ 19 , 26 , 29 , 38 , 40 ] 编码器/解码器 16.7 [ 22 , 28 , 40 , 46 , 48 ] RANSAC 16.7 [ 23 , 24 , 26 , 29 , 47 ] A* 16.7 [ 19 , 25 , 26 , 29 , 30 ] 卡尔曼滤波器 16.7 [ 23 , 25 , 26 , 30 , 39 ] YOLO 16.7 [ 32 , 33 , 35 , 42 , 45 ] VGG 13.3 [ 25 , 28 , 36 , 44 ] Inception 10 [ 37 – 39 ] 特定算法 20 [ 28 , 30 , 41 , 42 , 47 , 48 ]
压力是指身体对任何环境变化做出的生理、情绪和心理反应,需要进行调整,对人类心理产生重大影响。视障人士 (VIP) 的压力尤其难以控制,因为他们在未知情况下很容易感到压力。脑电图 (EEG) 信号可用于检测压力,因为它基本上代表了人类大脑中持续的电信号变化。文献表明,压力检测技术大多基于时域或频域分析。然而,使用时域或频域分析可能不足以提供适当的压力检测结果。因此,本文提出了一种使用经验模态分解 (EMD) 和短期傅里叶变换 (STFT) 从 EEG 信号中提取考虑时空信息的特征的方法。在 EMD 中,信号首先被分解为表示有限数量信号同时保持时域的固有模态函数 (IMF),然后使用 STFT 将时域转换为时频域。采用支持向量机 (SVM) 对陌生室内环境中 VIP 的压力进行分类。将所提方法的性能与最先进的压力检测技术进行了比较。实验结果证明了所提技术优于现有技术
视障儿童的学习和身心辅导很重要,但由于缺乏视觉感官的辅助,若没有适当的强化,体能活动会逐渐退化,可能需要他人的照顾,内心的恐惧和敏感的心理因素阻碍了生活能力的发展。加强视障儿童的体能活动,可提高其能力,减少心理障碍,有利于与他人和睦相处。本研究开发的分布式振动可以增强儿童的体能锻炼,通过音乐节奏,降低儿童的心理阻力,并通过分布式振动引发其身体动作,对视障儿童的体能活动产生影响。选取七名幼儿园适龄儿童参加为期16周的辅导,根据评估表、教学记录、家长或学生访谈记录得分。结果表明,振动和音乐有助于发展幼儿的运动技能。经过两次辅导后,玩家随着音乐和触觉信号的响起,参与的兴趣增加了。 P 演员能够用手和脚正确识别与振动和手势相对应的肢体。辅助技术对视障儿童的身体活动产生了积极影响。