Loading...
机构名称:
¥ 1.0

摘要——本文开发了一个基于 FPT.AI 的文本转语音 (TTS) 应用程序,可将越南语文本转换为口语。该应用程序支持 Django for Python 开发,形式为一个交互式网站,通过其应用程序编程接口 (API) 连接到 FPT.AI 服务器。该应用程序支持将文本转换为七种不同的越南语。七种声音中有四种通常用于在单组操作中转换多达 500 个字符,而其他几种则支持 400 个字符。根据获得的结果,第一次转换时间需要 10 秒才能将 400 个字符的文本转换为语音,而接下来几次,给定相同的文本,转换时间不到 1.8 秒。这适用于所有声音。

基于 FPT.AI 的文本转语音应用程序的端到端

基于 FPT.AI 的文本转语音应用程序的端到端PDF文件第1页

基于 FPT.AI 的文本转语音应用程序的端到端PDF文件第2页

基于 FPT.AI 的文本转语音应用程序的端到端PDF文件第3页

基于 FPT.AI 的文本转语音应用程序的端到端PDF文件第4页

基于 FPT.AI 的文本转语音应用程序的端到端PDF文件第5页