Loading...
机构名称:
¥ 1.0

摘要: - 手语动作的解释对于改善聋人和听力障碍者的交流可访问性至关重要。本研究提出了一个全面的计算框架,用于特征提取和长期记忆(LSTM)网络,以捕获跨手势序列的时间动态。CNN体系结构用于评估视觉输入,成功地识别和分类了对正确手势解释至关重要的手动形状,面部表情和身体姿势。通过添加LSTM,我们的方法有效地复制了手语的顺序性质,从而识别了先前运动影响的连续手势。我们使用众多创新策略来处理手语检测问题,例如签名样式,周围噪声以及实时处理的需求。多模式数据融合包含视觉,上下文和语言信息,以提高模型鲁棒性。旋转,缩放和时间变化被用作数据增强程序,以增加训练数据集并提高各种签名设置的模型适用性。混合CNN-LSTM体系结构通过超级参数调整,辍学正则化和批准化来增强,以减少过度拟合,同时保持出色。

关于手语姿态高级计算技术的调查

关于手语姿态高级计算技术的调查PDF文件第1页

关于手语姿态高级计算技术的调查PDF文件第2页

关于手语姿态高级计算技术的调查PDF文件第3页

关于手语姿态高级计算技术的调查PDF文件第4页

关于手语姿态高级计算技术的调查PDF文件第5页

相关文件推荐