如何开发双语语音助手 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

如何开发双语语音助手

2025年8月31日 16:00 33 Comments

探索使语音助手更个人化的方式首先出现在数据科学方面。

来源:走向数据科学

和Siri是为当今大多数Internet连接人群提供服务的无处不在的语音助手。在大多数情况下，英语是与这些语音助手一起使用的主要语言。但是，为了使语音助手真正提供帮助，它必须能够在自然说话时了解用户。在世界许多地方，尤其是在像印度这样的多元化国家中，人们通常是多语言并在一次对话中切换多种语言。真正聪明的助手应该能够处理这一点。

Google Assistant提供了添加第二语言的能力；但是它的功能仅限于某些设备，仅适用于有限的主要语言。例如，Google的Nest Hub尚未支持泰米尔语的双语功能，泰米尔语是超过8000万人使用的语言。只要在内部语言对中支持双语方法，Alexa就支持双语方法；同样，这仅支持一组有限的主要语言。 Siri没有双语能力，一次只允许一种语言。

在本文中，我将讨论使我的语音助手以英语和泰米尔语作为语言的双语能力所采用的方法。使用这种方法，语音助手将能够通过直接分析音频来自动检测人的语言。通过使用基于“置信分数”的算法，系统将确定英语或泰米尔语是否被说出并以相应的语言做出响应。

我的语音助手

双语能力的方法

fastText方法

一个更实用的解决方案是使用现有的预训练模型，该模型已针对特定任务进行了优化。对于语言识别，一个不错的选择是FastText。

fastText

要使用FastText，您可以下载相应的模型（Lid.176.bin）并将其存储在项目文件夹中。将其指定为Model_Path并加载模型。

识别器.recognize_google（音频） speech_recognition “帝国na” Unplash

助手语音 Siri 服务的语言的识别器训练模型语言提供有限的英语使用的 Google 能够实用的方法采用的能力双语泰米尔语项目文件相应的现有的文件夹