OpenAi推出了一个新的语音引擎，该引擎可以生成现实的表达语音 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

OpenAi推出了一个新的语音引擎，该引擎可以生成现实的表达语音

2025年3月22日 12:31 33 Comments

OpenAI最近推出了一个被称为“革新文本对数技术”的下一代语音引擎。这个新引擎可以仅根据15秒的声音录音来创建现实和表现力的语音。通过简单的命令和标签启用对语音的个性和语气的控制，它比以前的模型更进一步。 […] Post Openai上的新模型已经启动了一种新的语音引擎，该引擎可以首次出现在AI新闻上。

来源:AI新闻

OpenAI最近推出了一个被称为“革新文本对数技术”的下一代语音引擎。这个新引擎可以仅根据15秒的声音录音来创建现实和表现力的语音。通过简单的命令和标签启用对语音的个性和语气的控制，它比以前的模型更进一步。

新模型

新一代的音频模型代表了语音识别和语音综合方面的重大进展。 GPT-4O-Transcribe及其次要的GPT-4O-Mini-Transcribe的专门设计旨在以令人印象深刻的精确度转换为文本。与以前的模型相比，较小的变体可改善单词频率和对语言的更好理解。

OpenAi推出了三个新的强大模型

GPT-4O-TRANSCRICE：最先进的转录建模-4O-Mini-Transcribe：较轻的版本，用于较低的资源密集型应用程序gpt-4o-mini-tts：下一代语音引擎，用于文本到数字

GPT-4O-Transcribe：最先进的转录模型

GPT-4O-Transcribe

GPT-4O-MINI-TRANSCRIBL：用于较低资源密集型应用程序的较轻版本

gpt-4oo-mini trentcribe

GPT-4OO-MINI-TTS：文本工具的下一代语音引擎

GPT-4OO-MINI-TTS

对于那些有兴趣从文本中创建自然语音的人，OpenAI还推出了GPT-4O-Mini-TT，该模型可以生成具有改善可控性的现实和表现力的声音。特别令人印象深刻的是该模型捕捉自然语调和重点的能力。

根据Venture Beat，这些新模型最令人兴奋的是，它们可以在短短几秒钟内将其集成到现有的文本应用程序中。毫无疑问，这将加快语音控制应用程序的开发，并使它们更容易被更广泛的受众访问。

尝试自己-openai.fm演示能力

OpenAi.fm

可用性和定价

模型可直接通过OpenAI的API获得，并以下价格

较小的次要的新一代现实 OpenAI 语言的精确度先进的以前的创建模型工具的文本较低的 Transcribe 引擎重点的语音应用程序语音识别改善 MINI 可用性 Mini 广泛的 4O 印象根据可控性用于现有的 GPT 简单的下一代