使用Gradio构建交互式机器学习应用

在Minutesthe中创建一个有趣的文本对语音演示,构建Interactive Machine Learning应用程序,Gradio首先出现在数据科学上。

来源:走向数据科学

作为使用机器学习模型的开发人员,您可能会花费数小时编写脚本并调整超参数。但是,在分享您的工作或让其他人与模型互动时,Python脚本和可用的Web应用程序之间的差距会感到巨大。 Gradio是一个开源Python库,可让您将Python脚本转换为交互式Web应用程序,而无需前端专业知识。

gradio

在此博客中,我们将采用一种有趣的动手方法来学习关键的Gradio组件,通过构建文本到语音(TTS)Web应用程序,您可以在AI PC或Intel®Tibre™AI Cloud上运行,并与他人共享。 (全面披露:作者隶属于英特尔。)

文本到语音 AI PC intel®Tibre™AI云

我们项目的概述:tts python脚本

我们将使用COQUI TTS库及其XTTS_V2多语言模型开发一个基本的Python脚本。要继续进行此项目,请使用以下内容进行要求。TXT文件:

XTTS_V2 要求.txt
gradiocoqui-ttstorch

然后创建一个虚拟环境,然后使用

pip install -r要求.txt

另外,如果您使用的是Intel Tiber AI Cloud,或者如果您在系统上安装了UV软件包管理器,请创建虚拟环境并使用

UV软件包管理器
UV INIT - -BAREUV add -r Enesuption.txt

然后,您可以使用

uv run

gotcha警报与最近的依赖版本的兼容性,我们使用的是`coqui-tts',它是原始coqui`tts'的叉子。因此,请勿尝试使用PIP安装TTS安装原始软件包。

gotcha警报 coqui-tts tts PIP安装TTS

接下来,我们可以为脚本进行必要的导入:

导入tts.api导入tts

当前,`tts'可让您访问94个模型,您可以通过运行

print(tts()。list_models())

在此博客中,我们将使用XTTS-V2模型,该模型支持17种语言和58个说话者的声音。您可以加载模型并通过

fn