TUSUR 科学家研究耳语以改进语音识别算法 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

TUSUR 科学家研究耳语以改进语音识别算法

2018年2月8日 09:00 33 Comments

TUSUR 研究人员正在研究很少被研究的人类耳语语音，以创建高精度识别人类语音的算法。

来源:Robogeek新闻频道（关于机器人技术的俄罗斯与世界新闻）

TUSUR 研究人员正在研究很少被研究的人类耳语语音，以创建高精度识别人类语音的算法。

电子计算系统综合信息安全部（CIBES）正在利用这里创建的独特数学装置，在语音信号参数层面上进行人类语音识别研究。他们的结果可能是创建与现有算法根本不同的新算法，以正确且更准确地识别人类语音。

托木斯克居民的研究旨在解决全世界开发者的主要任务之一——实现任意卷的口语文本高精度、不失真的全自动翻译成书面文本。

“这一目标尚未实现，包括由于在已经工作的人机界面中最常使用的方法：语音搜索、聊天机器人，其中最多识别的是单个短语，例如搜索查询或“短信语音拨号”，KIBEVS 员工 Anton Konev 说道。

通用算法的基础是从大量语音、单词和短语的示例中进行学习。在识别过程中，系统概率性地确定口语单词最接近哪个嵌入示例。高精度地确定声音参数（人类听觉系统的特征）并不是在创作过程中解决的。

“因此，一旦一个人开始发音不是最常用的单词、缩写、罕见的名称、缩写，识别能力就会下降，现有系统会经常出错，”科涅夫强调道。 “此外，此类系统没有考虑到自发口头语言的结尾和其他特征的可变性，也没有考虑单个短语——俄语中的可变性尤其高，其中很大一部分声音被“吃掉”如果我们以平常的快节奏说话的话。”

确定识别单词可变性语音高精度短语示例创建人类系统算法