详细内容或原文请订阅后点击阅览
OpenAi推出了一个新的语音引擎,该引擎可以生成现实的表达语音
OpenAI最近推出了一个被称为“革新文本对数技术”的下一代语音引擎。这个新引擎可以仅根据15秒的声音录音来创建现实和表现力的语音。通过简单的命令和标签启用对语音的个性和语气的控制,它比以前的模型更进一步。 […] Post Openai上的新模型已经启动了一种新的语音引擎,该引擎可以首次出现在AI新闻上。
来源:AI新闻OpenAI最近推出了一个被称为“革新文本对数技术”的下一代语音引擎。这个新引擎可以仅根据15秒的声音录音来创建现实和表现力的语音。通过简单的命令和标签启用对语音的个性和语气的控制,它比以前的模型更进一步。
新模型
新一代的音频模型代表了语音识别和语音综合方面的重大进展。 GPT-4O-Transcribe及其次要的GPT-4O-Mini-Transcribe的专门设计旨在以令人印象深刻的精确度转换为文本。与以前的模型相比,较小的变体可改善单词频率和对语言的更好理解。
OpenAi推出了三个新的强大模型
- GPT-4O-TRANSCRICE:最先进的转录建模-4O-Mini-Transcribe:较轻的版本,用于较低的资源密集型应用程序gpt-4o-mini-tts:下一代语音引擎,用于文本到数字
对于那些有兴趣从文本中创建自然语音的人,OpenAI还推出了GPT-4O-Mini-TT,该模型可以生成具有改善可控性的现实和表现力的声音。特别令人印象深刻的是该模型捕捉自然语调和重点的能力。
根据Venture Beat,这些新模型最令人兴奋的是,它们可以在短短几秒钟内将其集成到现有的文本应用程序中。毫无疑问,这将加快语音控制应用程序的开发,并使它们更容易被更广泛的受众访问。
尝试自己-openai.fm演示能力
OpenAi.fm可用性和定价
模型可直接通过OpenAI的API获得,并以下价格