获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
与开放研究的非营利性AI研究实验室同时翻译技术Kyutai的技术已发布Hibiki,这是一种针对语音到语音翻译的新音频模型。hibiki(日语中的“回声”)可以同时进行翻译,同时保留说话者的声音,并最佳地适应源语音的语义内容。hibiki用目标语言实时生产口头翻译以及书面的翻译。Hibiki目前接受了从法语到英语翻译的培训,在翻译质量,扬声器忠诚度和自然性方面的最先进表现都展示了这一任务。此外,其推理过程的简单性使其与批处理的翻译兼容,以进行有效的在线部署以及实时的实时使用。在Moshi发行仅六个月后,Kyutai的声音AI是全双工口语对话的AI,如今已通过公众共享推理代码,法语到英语模型的权重和技术报告,使Hibiki开创性的技术可用。研究人员和AI社区现在将能够在Hibiki的顶部建立,并将其扩展到其他语言。这是语音技术的新里程碑,它为沟通和可访问性开辟了非凡的机会。