OpenAi推出了一个新的语音引擎,该引擎可以生成现实的表达语音

OpenAI最近推出了一个被称为“革新文本对数技术”的下一代语音引擎。这个新引擎可以仅根据15秒的声音录音来创建现实和表现力的语音。通过简单的命令和标签启用对语音的个性和语气的控制,它比以前的模型更进一步。 […] Post Openai上的新模型已经启动了一种新的语音引擎,该引擎可以首次出现在AI新闻上。

来源:AI新闻

OpenAI最近推出了一个被称为“革新文本对数技术”的下一代语音引擎。这个新引擎可以仅根据15秒的声音录音来创建现实和表现力的语音。通过简单的命令和标签启用对语音的个性和语气的控制,它比以前的模型更进一步。

新模型

新一代的音频模型代表了语音识别和语音综合方面的重大进展。 GPT-4O-Transcribe及其次要的GPT-4O-Mini-Transcribe的专门设计旨在以令人印象深刻的精确度转换为文本。与以前的模型相比,较小的变体可改善单词频率和对语言的更好理解。

OpenAi推出了三个新的强大模型

    GPT-4O-TRANSCRICE:最先进的转录建模-4O-Mini-Transcribe:较轻的版本,用于较低的资源密集型应用程序gpt-4o-mini-tts:下一代语音引擎,用于文本到数字
  • GPT-4O-Transcribe:最先进的转录模型
  • GPT-4O-Transcribe
  • GPT-4O-MINI-TRANSCRIBL:用于较低资源密集型应用程序的较轻版本
  • gpt-4oo-mini trentcribe
  • GPT-4OO-MINI-TTS:文本工具的下一代语音引擎
  • GPT-4OO-MINI-TTS

    对于那些有兴趣从文本中创建自然语音的人,OpenAI还推出了GPT-4O-Mini-TT,该模型可以生成具有改善可控性的现实和表现力的声音。特别令人印象深刻的是该模型捕捉自然语调和重点的能力。

    根据Venture Beat,这些新模型最令人兴奋的是,它们可以在短短几秒钟内将其集成到现有的文本应用程序中。毫无疑问,这将加快语音控制应用程序的开发,并使它们更容易被更广泛的受众访问。

    尝试自己-openai.fm演示能力

    OpenAi.fm

    可用性和定价

    模型可直接通过OpenAI的API获得,并以下价格