详细内容或原文请订阅后点击阅览
在本地运行实时语音到语音 AI 模型
在本指南中,您将逐步学习如何在本地安装和运行 PersonaPlex,以便您可以直接在自己的机器上体验实时、可中断的语音到语音 AI。
来源:KDnuggets简介
在我们开始之前,我希望您观看此视频:
这不是很神奇吗?我的意思是,您现在可以运行一个完整的本地模型,您可以在自己的机器上与之对话,并且它开箱即用。感觉就像与真人交谈,因为系统可以同时听和说,就像自然对话一样。
这不是通常的“你说话,然后它等待,然后它回复”的模式。PersonaPlex 是一种实时语音到语音对话人工智能,可以处理你说话时的中断、重叠和自然对话提示,例如“嗯嗯”或“对”。
PersonaPlex 设计为全双工,因此它可以同时收听和生成语音,而无需强制用户先暂停。与传统的语音助手相比,这使得对话感觉更加流畅和人性化。
在本教程中,我们将学习如何设置 Linux 环境,在本地安装 PersonaPlex,然后启动 PersonaPlex Web 服务器,以便您可以在浏览器中与 AI 实时交互。
在本地使用 PersonaPlex:分步指南
在本节中,我们将介绍如何在 Linux 上安装 PersonaPlex、启动实时 WebUI,并开始与在我们自己的计算机上本地运行的全双工语音到语音 AI 模型进行对话。
第 1 步:接受模型条款并生成令牌
在下载并运行 PersonaPlex 之前,您必须接受 Hugging Face 上模型的使用条款。 NVIDIA 的语音转语音模型 PersonaPlex-7B-v1 是门控的,这意味着在您同意模型页面上的许可条件之前,您无法访问权重。
转到 Hugging Face 上的 PersonaPlex 模型页面并登录。您将看到一条通知,表明您需要同意共享您的联系信息并接受许可条款才能访问文件。查看 NVIDIA 开放模型许可证并接受解锁存储库的条件。
授予访问权限后,创建 Hugging Face 访问令牌:
