摘要——本文开发了一个基于 FPT.AI 的文本转语音 (TTS) 应用程序,可将越南语文本转换为口语。该应用程序支持 Django for Python 开发,形式为一个交互式网站,通过其应用程序编程接口 (API) 连接到 FPT.AI 服务器。该应用程序支持将文本转换为七种不同的越南语。七种声音中有四种通常用于在单组操作中转换多达 500 个字符,而其他几种则支持 400 个字符。根据获得的结果,第一次转换时间需要 10 秒才能将 400 个字符的文本转换为语音,而接下来几次,给定相同的文本,转换时间不到 1.8 秒。这适用于所有声音。