摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周的 12 种手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周内 12 个手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周内 12 个手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周内 12 个手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周内 12 个手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
摘要:对于成功应用脑部计算机界面(BCI)系统,脑电图(EEG)信号的准确认可是核心问题之一。解决各个脑电图信号的差异以及分类和识别中脑电图数据较少的问题,设计了一个基于注意机制的多尺度卷积网络;然后引入转移学习数据对齐算法,以探索转移学习的应用,以分析运动图像EEG信号。使用BCI竞争IV的数据集2A用于验证设计的双通道注意模块迁移与卷积神经网络(MS-AFM)。实验结果表明,分类识别率随着对齐算法的添加和转移学习中的自适应调整而提高。九名受试者的平均分类识别率为86.03%。
在这项研究中,我们提出了一种方法,可以使Cansat识别和指导一个目标,即甚至距目标10 m,并描述说明性评估的结果,以确保该方法的有效性。我们第一次将深度学习图像分类应用于Cansat中的目标识别,并在2019年Arliss Arliss中使用了几乎一路指导它,在所有三场比赛中都将其引导到目标,并赢得了第一个位置,成为整体胜利。然而,常规方法具有回溯性,因为当Cansat距离目标超过6-7 m时,目标识别率显着下降,这使得由于各种因素,因此很难将Cansat转移到目标时。为了使目标识别距离目标10 m的距离,我们研究了感兴趣的划分水平区域的数量以及图像识别过程中垂直移动的方法,并使用实验确定了有效的划分和识别率的数量。尽管对象检测通常用于通过深度学习从图像中检测对象的位置,但我们确定了该方法在长时间差异时具有更高的识别率,而计算时间比SSD Mo-Bilenet V1更短。此外,我们还参加了《 Cansat竞赛法案》 2020年,以评估拟议方法的有效性,并在所有三场比赛中实现了零距离的目标,并通过在复出类别中赢得第一名来证明其有效性。
摘要 — 通过技术手段进行手臂和手部跟踪可以收集可用于确定手势含义的数据。为此,机器学习算法主要被研究以寻求最高识别率和最短识别时间之间的平衡。然而,这种平衡主要来自统计模型,而统计模型很难解释。相反,我们提出了 µC 1 和 µC 2 ,这两种基于几何模型的手势识别方法支持识别过程的可视化和几何解释。我们将 µC 1 和 µC 2 与两种经典机器学习算法 k-NN 和 SVM 以及两种最先进的深度学习模型 BiLSTM 和 GRU 进行比较,实验数据集包含意大利手语 (LIS) 中的十个手势类别,每个手势类别由五名缺乏经验的非母语手语者重复 100 次,并使用可穿戴技术(传感手套和惯性测量单元)收集。结果,我们在高识别率(> 90%)和低识别时间(< 0 .1 秒)之间取得了折衷,这足以实现人机交互。此外,我们基于几何代数详细阐述了算法的几何解释,这有助于理解识别过程。
AI学习数据质量改进支持工具将物体检测中误识别或未检测的原因可视化,从而轻松提高识别率。 通过在深度学习过程中使用此工具,可以缩短使用 RZ/V 系列的视觉 AI 应用程序的开发时间。
Jörg Buxbaum DFS 德国航空安全有限公司 Joerg.Buxbaum@dfs.de Christian Kern 奥地利控制局 Christian.Kern@austrocontrol.at 摘要 — 将自动语音识别集成到空中交通管理 (ATM) 中的举措至少自 20 世纪 90 年代末就已存在。据报道,它成功地取代了伪飞行员,但尚未将其集成到管制员助理工具中。德国航空航天中心 (DLR) 和萨尔大学开发了基于助理的语音识别 (ABSR),使指令识别率超过 95%。然而,良好的识别率并不能说服决策者。因此,我们对 8 名空中交通管制员进行了 ABSR 验证研究,以量化其在工作量和效率方面的优势。研究证实,ABSR 不仅能减少管制员的工作量(本来就很多),而且本文还指出,ABSR 还能显著提高 ATM 效率。每趟航班可节省 60 升(16 加仑)燃油,每小时可增加两架飞机的吞吐量。