详细内容或原文请订阅后点击阅览
TUSUR 科学家研究耳语以改进语音识别算法
TUSUR 研究人员正在研究很少被研究的人类耳语语音,以创建高精度识别人类语音的算法。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)TUSUR 研究人员正在研究很少被研究的人类耳语语音,以创建高精度识别人类语音的算法。
电子计算系统综合信息安全部(CIBES)正在利用这里创建的独特数学装置,在语音信号参数层面上进行人类语音识别研究。他们的结果可能是创建与现有算法根本不同的新算法,以正确且更准确地识别人类语音。
托木斯克居民的研究旨在解决全世界开发者的主要任务之一——实现任意卷的口语文本高精度、不失真的全自动翻译成书面文本。
“这一目标尚未实现,包括由于在已经工作的人机界面中最常使用的方法:语音搜索、聊天机器人,其中最多识别的是单个短语,例如搜索查询或“短信语音拨号”,KIBEVS 员工 Anton Konev 说道。
通用算法的基础是从大量语音、单词和短语的示例中进行学习。在识别过程中,系统概率性地确定口语单词最接近哪个嵌入示例。高精度地确定声音参数(人类听觉系统的特征)并不是在创作过程中解决的。
“因此,一旦一个人开始发音不是最常用的单词、缩写、罕见的名称、缩写,识别能力就会下降,现有系统会经常出错,”科涅夫强调道。 “此外,此类系统没有考虑到自发口头语言的结尾和其他特征的可变性,也没有考虑单个短语——俄语中的可变性尤其高,其中很大一部分声音被“吃掉”如果我们以平常的快节奏说话的话。”