在本地运行实时语音到语音 AI 模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

在本地运行实时语音到语音 AI 模型

2026年3月11日 14:00 33 Comments

在本指南中，您将逐步学习如何在本地安装和运行 PersonaPlex，以便您可以直接在自己的机器上体验实时、可中断的语音到语音 AI。

来源:KDnuggets

在我们开始之前，我希望您观看此视频：

这不是很神奇吗？我的意思是，您现在可以运行一个完整的本地模型，您可以在自己的机器上与之对话，并且它开箱即用。感觉就像与真人交谈，因为系统可以同时听和说，就像自然对话一样。

这不是通常的“你说话，然后它等待，然后它回复”的模式。PersonaPlex 是一种实时语音到语音对话人工智能，可以处理你说话时的中断、重叠和自然对话提示，例如“嗯嗯”或“对”。

PersonaPlex 设计为全双工，因此它可以同时收听和生成语音，而无需强制用户先暂停。与传统的语音助手相比，这使得对话感觉更加流畅和人性化。

在本教程中，我们将学习如何设置 Linux 环境，在本地安装 PersonaPlex，然后启动 PersonaPlex Web 服务器，以便您可以在浏览器中与 AI 实时交互。

在本节中，我们将介绍如何在 Linux 上安装 PersonaPlex、启动实时 WebUI，并开始与在我们自己的计算机上本地运行的全双工语音到语音 AI 模型进行对话。

在下载并运行 PersonaPlex 之前，您必须接受 Hugging Face 上模型的使用条款。 NVIDIA 的语音转语音模型 PersonaPlex-7B-v1 是门控的，这意味着在您同意模型页面上的许可条件之前，您无法访问权重。

转到 Hugging Face 上的 PersonaPlex 模型页面并登录。您将看到一条通知，表明您需要同意共享您的联系信息并接受许可条款才能访问文件。查看 NVIDIA 开放模型许可证并接受解锁存储库的条件。

授予访问权限后，创建 Hugging Face 访问令牌：

转到设置 → 访问令牌

复制生成的 token

接受访问许可证服务器语音计算机 PersonaPlex 人工智能自己的感觉生成通常的条款模型实时令牌意味着模型的许可 Hugging 运行的完整的全双工对话希望 Face 传统的