摘要 - 在计算机视觉和自主系统的领域,对象识别和障碍识别是关键任务,每个任务都为人们和移动机器人的智能能力和安全性提供了独特的贡献。虽然对象识别侧重于识别和分类数字图像或视频帧中的对象,但障碍识别专门用于检测和本地化环境中的障碍或危害。使用机器学习,计算机视觉,Yolov4体系结构和可可数据集的对象识别,并特别强调视力受损的个体。这项研究集成了Yolov4和可可数据集,旨在提高对象识别,同时利用障碍识别的益处。研究包括硬件实现,包括带有7英寸LCD的Raspberry Pi和涉及机器学习模型的软件实现。测试结果揭示了系统的鲁棒性和实时功能。此外,在Phramongkutklao医院展览会上进行的用户体验测试获得了积极的反馈,这对于建立以用户为中心的方法来开发适合其需求的对象识别技术是有价值的输入。这项研究有望在复杂环境中对智能系统的对象识别做出宝贵的贡献。
方法 % 至论文参考。到论文 SLAM 16.7 [ 19 , 26 , 29 , 38 , 40 ] 编码器/解码器 16.7 [ 22 , 28 , 40 , 46 , 48 ] RANSAC 16.7 [ 23 , 24 , 26 , 29 , 47 ] A* 16.7 [ 19 , 25 , 26 , 29 , 30 ] 卡尔曼滤波器 16.7 [ 23 , 25 , 26 , 30 , 39 ] YOLO 16.7 [ 32 , 33 , 35 , 42 , 45 ] VGG 13.3 [ 25 , 28 , 36 , 44 ] Inception 10 [ 37 – 39 ] 特定算法 20 [ 28 , 30 , 41 , 42 , 47 , 48 ]
摘要最近几年在智能对象(SOS)领域取得了长足的进步:它们的数量,多样性,性能和普遍性都在迅速增加,预计这种演变将继续下去。据我们所知,几乎没有做出的工作来利用丰富的资源来开发视力障碍者(VIP)的辅助设备。但是,我们认为SOS既可以增强传统的辅助功能(即障碍物检测,导航)并提供与环境互动的新方法。在描述了SOS启用的空间和非空间感知功能之后,本文介绍了SO2Sees,该系统旨在成为其用户和相邻SOS之间的接口。SO2SEES允许VIP以直观的方式查询SOS,依靠在物联网(IoT)云平台上分发的知识库和SO2Sees自己的后端。为了评估和验证裸露的概念,我们使用语义Web标准开发了SO2SEES系统的简单工作实现。围绕该早期SO2SEES系统建立了一种受控的环境测试方案,以证明其可行性。作为未来的工作,我们计划使用VIP最终用户进行该第一个原型的现场实验。
游戏描绘了一个智能的家庭厨房环境。玩家有一个与客人计划的晚餐约会,灯光熄灭。为了完成游戏,需要在客人到来之前准备一顿饭菜,完全在黑暗中。数字语音助手会在整个体验中引导用户,提醒他们食谱,烹饪程序,时间限制以及如何找到每种所需的成分和餐具。智能家居使声音能够以数字腹膜式的方式从不同的对象投影[6],可帮助用户在没有任何视觉提示的情况下找到必要的资源。语音助手能够对与任务相关的玩家问题进行语音识别,理解和答复。所有用户任务都需要用户的微观运动感,即感知障碍和危害的直接环境[13],这是由智能家居通过辅助技术方式提供的。大多数任务只是基于发现和重新定位的对象,例如将意大利面放入锅中。难度依赖于缺乏愿景:需要仅根据声音和触觉指导找到资源。游戏中代表的大多数物体都是真实的,例如食物,水和厨房用具,通过被动性触觉改善玩家的存在感[5]。
视障儿童的学习和身心辅导很重要,但由于缺乏视觉感官的辅助,若没有适当的强化,体能活动会逐渐退化,可能需要他人的照顾,内心的恐惧和敏感的心理因素阻碍了生活能力的发展。加强视障儿童的体能活动,可提高其能力,减少心理障碍,有利于与他人和睦相处。本研究开发的分布式振动可以增强儿童的体能锻炼,通过音乐节奏,降低儿童的心理阻力,并通过分布式振动引发其身体动作,对视障儿童的体能活动产生影响。选取七名幼儿园适龄儿童参加为期16周的辅导,根据评估表、教学记录、家长或学生访谈记录得分。结果表明,振动和音乐有助于发展幼儿的运动技能。经过两次辅导后,玩家随着音乐和触觉信号的响起,参与的兴趣增加了。 P 演员能够用手和脚正确识别与振动和手势相对应的肢体。辅助技术对视障儿童的身体活动产生了积极影响。
摘要当前的挑战是通过开发信息技术来确保视障人士对艺术对象的可访问性,从而将2D图像转换为3D模型并在盲文中为其生成描述。盲人的大脑能够将触觉信息转换为视觉图像,因此使用3D建模和3D打印技术创建的触觉绘画将使盲人用指尖“看到”艺术杰作。The variable height of volumetric elements when creating tactile graphics for blind people can effectively and intuitively transmit various types of information, so when developing information technology for ensuring accessibility to art objects for the visually impaired persons, an important and urgent task is to recognize a 2D image and its 3D modeling (building up the relief to obtain an image of a three- dimensional object, as well as a mathematical model that describes the structure of the object, the location of它在空间上的观点,以及对象表面的数学描述)。对2D图像识别的已知方法和工具的分析及其3D建模表明,目前,3D模型中渲染艺术对象(绘画)的方法和工具当前不发达。提出的信息技术,用于确保视力障碍者自动化的艺术对象的可访问性(为了简化实现),将2D图片转换为其3D模型,准备在3D打印机上打印,还可以在Braille中生成图片的描述,准备在Typhlloprinter上打印。
Abstract: This paper presented the assessment of cognitive load (as an e ff ective real-time index of task di ffi culty) and the level of brain activation during an experiment in which eight visually impaired subjects performed two types of tasks while using the white cane and the Sound of Vision assistive device with three types of sensory input—audio, haptic, and multimodal (audio and haptic simultaneously).第一个任务是识别对象属性,第二个任务是导航并避免在虚拟环境和现实世界设置中遇到障碍。结果表明,触觉刺激的直观不如音频,而视觉设备声音的导航增加了认知负载和工作记忆。在多模式刺激的情况下,视觉皮层不对称性比单独刺激(音频或触觉)低。无论导航或感觉输入的类型如何,视觉皮质活动与导航过程中的碰撞数量之间没有相关性。使用设备时,可激活视觉皮层,但仅适用于晚期用户。对于所有受试者,与白色的拐杖导航相比,用视觉设备的声音导航会引起低负价。
该项目的目的是设计和构建一个基于视觉的AI系统,该系统利用深度学习技术来帮助视力障碍和盲人。失去视野,家人,朋友和社会的个人都受到影响。完全的视力丧失或退化可能令人恐惧和压倒性,使那些受影响的人怀疑自己保持独立性,支付必要的医疗费用,保持工作并养家糊口。视力丧失具有深远的健康影响,超出了眼睛和视觉系统。跌倒,伤害和心理健康,认知,社会功能,就业和教育水平的恶化都与视力丧失有关。该项目旨在为使用最先进的深度学习技术提供基于视觉的解决方案。关键字:机器学习,深度学习,计算机视觉,面部识别,Google云视觉,分类,对象检测。
摘要:为了有效地检测由虚拟现实环境引起的运动疾病,我们开发了一种专门设计用于视觉诱导的运动疾病的分类模型,采用了相位锁定值(PLV)功能连接矩阵和CNN-LSTM架构。该模型解决了传统机器学习算法的缺点,尤其是它们在处理非线性数据方面的功能有限。我们使用来自25名参与者的EEG数据构建了基于PLV的功能连接矩阵和网络拓扑图。我们的分析表明,视觉诱发的运动疾病显着改变了脑电图中的同步模式,尤其是影响额叶和颞叶。功能连接矩阵用作我们的CNN-LSTM模型的输入,该模型用于对视觉诱导的运动疾病的状态进行分类。该模型表现出优于其他方法的优越性能,从而达到了伽马频带中最高的分类精度。具体来说,二进制分类的最高平均准确度为99.56%,三元分类达到86.94%。这些结果强调了该模型的分类有效性和稳定性,使其成为帮助诊断运动疾病的宝贵工具。
无人机已成为商业、安全工作和家庭休闲活动的固定装置。研究人员已经开始探索无人机如何帮助残疾人驾驶并充当辅助设备。我们的工作重点是视力障碍人士,并调查是什么促使他们驾驶无人机。我们对视障成年人进行了一项调查,以了解他们对无人机驾驶的普遍兴趣和以往的无人机使用经验。从 59 份调查回复中,我们采访了 13 位参与者,详细说明他们如何设想使用无人机,以及不同的反馈和驾驶模式如何使飞行体验更容易获得。我们发现,我们的参与者对航空、尝试新技术、环境探索以及寻找与视力正常的家庭成员一起进行的合作活动有着浓厚的兴趣,这延伸到了对驾驶无人机的兴趣。这项研究有助于为未来无人机的设计场景和可访问功能奠定基础。