苹果公司 (“苹果”)、LG 电子公司、LG 电子美国公司 1 和谷歌有限责任公司 (“谷歌”) 提交了美国专利号 7,933,431 (“'431 专利”) 的当事人复审 (“IPR”) 请求。专利审判和上诉委员会 (“委员会”) 加入了请求并发布了最终书面决定,认为权利要求 1-10、12 和 14-31 不具有可专利性,而权利要求 11 和 13 具有可专利性。苹果公司诉 Gesture Tech. Partners, LLC,编号 IPR2021-00920、IPR2022-00091、IPR2022-00359、2022 WL 17364390,第 *16 页 (PTAB 2022 年 11 月 30 日) (“最终书面决定”)。苹果公司对委员会关于权利要求 11 和 13 未被证明不可授予专利的裁定提起上诉。Gesture Technology Partners, LLC(“Gesture”)对委员会关于权利要求 1、7、12 和 14 不可授予专利的裁定提起交叉上诉,并辩称,由此推论,所有基于这些权利要求的权利要求均不可授予专利。
摘要 — 人机交互中的手势识别是人工智能和计算机视觉领域的一个活跃研究领域。为了估计现实环境中的手势识别性能,我们收集了考虑到杂乱背景、机器人的各种姿势和运动的手势数据,然后评估机器人的性能。这涉及骨架跟踪,其中骨架数据是由通过 Microsoft Kinect 传感器获得的深度图像生成的。Kinect 捕获 3D 空间中的人体手势,并由机器人处理和复制。Arduino 控制器用于控制机器人的运动,它将来自 Kinect 传感器的关节角度输入并将其反馈给机器人电路,从而控制机器人的动作。手势识别研究的主要目标是创建一个可以识别特定人体手势并将其用于设备控制的系统。手势控制机器人将在未来节省大量的劳动力成本。这种机器人的基本优势是它具有成本效益并且不需要远程控制。
虚拟鼠标控制器具有广泛的应用程序,尤其是在卫生和可访问性的环境中,例如在医疗环境,公共信息亭和交互式显示中。它还提供了传统输入设备的更符合人体工程学的替代方案,减少了应变并在扩展计算机使用过程中促进更健康的姿势。此外,可以对系统进行自定义以支持各种手势和个性化配置,从而适应各种用户和任务。通过增强残障人士的可及性并提供更直观的界面,虚拟鼠标控制器展示了基于手势的技术在革新人类计算机互动中的潜力,为日常计算和专业应用开辟了新的可能性。
摘要 - 在高分辨率事件摄像机的能力驱动的基于事件的视觉中的突破,具有显着改善的人类机器人相互作用。事件摄像机在管理动态范围和运动模糊方面表现出色,无缝适应各种环境条件。本文提出的研究利用这项技术开发了能够解释手势进行精确机器人控制的直觉机器人指导系统。我们介绍了“ Eb Handgesture”数据集,这是一种与我们的网络“ Convrnn”结合使用的创新高分辨率手势数据集,以在解释任务中证明95.7%的值得称赞的精度,涵盖了不同照明场景中的六种手势类型。为了验证我们的框架,使用ARI机器人进行了现实生活实验,从而确认了在各种相互作用过程中训练有素的网络的有效性。这项研究代表了确保共享工作空间中更安全,更可靠,更有效的人类机器人协作的实质性飞跃。索引术语 - 基于现实的手势识别,机器人控制,手势数据集
本文提出了一种使用YOLO算法估算车速的新方法。通过分析车辆沿连续线的运动,系统可以计算车辆的移动速度以及覆盖已知距离所需的时间。与基于物理数据的传统方法不同,此方法仅使用视频数据,使其无创和可用作为现有监视摄像机。Yolo附加使用或复杂安装。与传统方法相比,这种方法侧重于诸如准确性,适用性和及时性等因素。通过成功的实验,我们证明了基于YOLO的系统可以高精度估算车辆速度,并为自动驾驶汽车控制和交通管理提供了良好的解决方案。该计划还提供了一个机会,可以通过为全球交通监控提供成本效益和大规模的解决方案来改变交通监控。
1 Institute for Advanced Consciousness Studies, Santa Monica, CA, United States, 2 Media Lab, Massachusetts Institute of Technology, Cambridge, MA, United States, 3 Emlyon Business School, Ecully, France, 4 Independent Developer, Paris, France, 5 Aura Healthcare, Paris, France, 6 Centre for Research and Interdisciplinarity, University of Paris, Paris, France, 7 Centre for Philosophy of Science,里斯本大学,里斯本大学科学学院,葡萄牙8,认知神经科学研究所,伦敦大学学院,伦敦大学,英国,计算与传播学院,开放大学9号计算机与通讯学院,英国爱丁堡,英国爱丁堡,人类自然,人工智能和神经科学中心10法国BobignyUniversité,Bobigny,ParisCité大学12号,Inserm,UMR-S 1266,精神病学研究所和巴黎神经科学研究所,Inserm U1266,巴黎,法国,法国
摘要。目的。运动脑机接口 (BCI) 是一种很有前途的技术,可以使运动障碍者与周围环境互动。BCI 可能会弥补手臂和手部功能的丧失,这是四肢瘫痪患者的首要任务。设计实时准确的 BCI 对于使此类设备在现实环境中有用、安全且易于患者使用至关重要。基于皮层脑电图 (ECoG) 的 BCI 是记录设备的侵入性和记录信号的良好空间和时间分辨率之间的良好折衷。然而,用于预测连续手部运动的大多数 ECoG 信号解码器都是线性模型。这些模型的表示能力有限,可能无法捕捉 ECoG 信号特征与连续手部运动之间的关系。深度学习 (DL) 模型在许多问题中都是最先进的,可以成为更好地捕捉这种关系的解决方案。方法。在本研究中,我们测试了几种基于 DL 的架构,以使用从 ECoG 信号中提取的时频特征来预测想象的 3D 连续手部平移。分析中使用的数据集是长期临床试验 (ClinicalTrials.gov 标识符:NCT02550522) 的一部分,是在对四肢瘫痪受试者的闭环实验中获得的。所提出的架构包括多层感知器 (MLP)、卷积神经网络 (CNN) 和长短期记忆网络 (LSTM)。使用余弦相似度离线比较了基于 DL 和多线性模型的准确性。主要结果。我们的结果表明,基于 CNN 的架构优于当前最先进的多线性模型。最佳架构利用 CNN 来利用相邻电极之间的空间相关性,并通过使用 LSTM 来受益于所需手部轨迹的顺序特性。总体而言,与多线性模型相比,DL 将平均余弦相似度提高了 60%,左手和右手分别从 0.189 提高到 0.302 和从 0.157 提高到 0.249。意义。这项研究表明,基于 DL 的模型可以提高 BCI 系统在四肢瘫痪受试者的 3D 手部翻译预测中的准确性。
摘要计算机应用程序的进步已经越来越促进了日常任务,最近的创新集中在语音助手和虚拟输入设备上。该技术对具有移动性挑战的个体或直接手动计算机交互的情况有限。利用计算机视觉和人工智能,这些应用程序可以解释视觉数据,例如人类运动,并决定执行相应的命令。本研究结合了语音助手,虚拟鼠标和虚拟键盘,以增强可访问性和可用性,特别是对于身体残疾人或喜欢替代输入方法的人。使用Python,MediaPipe和OpenCV,该应用程序有效地处理和解释用户手势,提供响应迅速,有效的计算体验。MediaPipe的功能特别有助于模型的精确度,优化了对AI驱动任务的手动跟踪和手势识别。用户可以通过各种手势来控制计算机光标,使用彩色盖或磁带在虚拟键盘上键入,并执行诸如左键单击和拖动项目之类的基本操作。这种集成的解决方案旨在提高生产率,使计算机更容易访问并增强用户的整体数字体验。在此类应用中,AI和计算机视觉的融合继续推动了创新和包容性的计算解决方案,并承诺在人类计算机互动中具有更大的可访问性和便利性的未来。
大多数日常活动需要灵巧地使用手和手指。残疾人的手部假肢可以通过连接到上肢的表面电极非侵入式获取的表面肌电图 (sEMG) 信号来控制。在对从 10 位截肢者获取的 12 个电极 sEMG 信号进行预处理后,计算了时域和频域中的不同特征。考虑到 sEMG 是一种复杂、随机、非平稳和非线性信号,还通过多重分形去趋势波动分析 (MFDFA) 的方法提取了复杂的非线性特征。使用不同的分类方法(包括支持向量机 (SVM)、线性判别分析 (LDA) 和多层感知器 (MLP))来比较它们在八种不同手指运动分类中的表现。观察发现,SVM 在手指运动分类方面的表现优于其他两个分类器。新特征与传统特征融合后,分类准确率、精确率、召回率(灵敏度)分别为98.70%、98.74%、98.67%。结果表明,加入MFDFA提取的新特征与其他传统特征,可以有效提高数据采集效果。
心电图(ECG)是通过分析心脏的电活动来评估心脏健康的重要诊断工具。本研究探讨了机器学习(ML)技术在ECG图形分析中的应用,旨在提高诊断心血管疾病的准确性和效率。通过临床咨询收集了一种多种心电图信号数据集,包括正常情况和异常病例。采用预处理技术来消除噪声,然后进行特征提取以识别临界模式。机器学习模型,包括支持向量机(SVM),随机森林和卷积神经网络(CNN),用于对诸如正常窦性心律,心房颤动和心室心动过速等节律进行分类。所提出的方法为协助临床医生在早期发现和诊断心脏条件下提供了一种可靠,有效的方法,其准确性,敏感性和特异性方面有希望的结果。