语音识别训练数据 - 类型、数据收集和应用 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

语音识别训练数据 - 类型、数据收集和应用

2022年3月15日 05:50 33 Comments

如果您在日常生活中使用 Siri、Alexa、Cortana、Amazon Echo 或其他产品，您会接受语音识别已成为我们生活中无处不在的一部分。这些人工智能语音助手将用户的口头查询转换为文本，解释和理解用户所说的内容以得出 […]

来源:Shaip 博客

如果您在日常生活中使用 Siri、Alexa、Cortana、Amazon Echo 或其他语音助手，那么您就会接受语音识别已成为我们生活中无处不在的一部分。这些人工智能语音助手将用户的口头查询转换为文本，解释和理解用户所说的内容，以得出适当的回应。

语音识别 人工智能

需要收集高质量的数据来开发可靠的语音识别模型。但是，开发语音识别软件并非易事——正是因为转录人类语音的所有复杂性（例如节奏、口音、音调和清晰度）很困难。而且，当您将情感添加到这种复杂的组合中时，它就变成了一项挑战。

语音识别软件

什么是语音识别？

语音识别是软件识别人类语音并将其处理为文本的能力。虽然语音识别和语音识别之间的差异对许多人来说似乎是主观的，但两者之间存在一些根本差异。

人类语音

虽然语音和语音识别都是语音助手技术的一部分，但它们执行两种不同的功能。语音识别会自动将人类语音和命令转录为文本，而语音识别仅处理识别说话者的声音。

语音识别的类型

在进入语音识别类型之前，让我们简单看一下语音识别数据。

语音识别类型

语音识别数据是人类语音录音和文本转录的集合，有助于训练机器学习系统进行语音识别。

语音识别

将录音和转录输入 ML 系统，以便训练算法识别语音的细微差别并理解其含义。

自定义数据集

语音数据 单词或短语 语音命令

语音添加文本助手识别类型用户人类数据软件语音识别成为转录