与开放研究的非营利性AI研究实验室同时翻译技术Kyutai的技术已发布Hibiki,这是一种针对语音到语音翻译的新音频模型。hibiki(日语中的“回声”)可以同时进行翻译,同时保留说话者的声音,并最佳地适应源语音的语义内容。hibiki用目标语言实时生产口头翻译以及书面的翻译。Hibiki目前接受了从法语到英语翻译的培训,在翻译质量,扬声器忠诚度和自然性方面的最先进表现都展示了这一任务。此外,其推理过程的简单性使其与批处理的翻译兼容,以进行有效的在线部署以及实时的实时使用。在Moshi发行仅六个月后,Kyutai的声音AI是全双工口语对话的AI,如今已通过公众共享推理代码,法语到英语模型的权重和技术报告,使Hibiki开创性的技术可用。研究人员和AI社区现在将能够在Hibiki的顶部建立,并将其扩展到其他语言。这是语音技术的新里程碑,它为沟通和可访问性开辟了非凡的机会。
Hibikino-Musashi@Home (HMA) 是一个由日本九州工业大学和北九州大学的学生组成的机器人开发团队。该团队成立于 2010 年,曾参加过开放平台联盟 (OPL)、国内标准平台联盟 (DSPL) 和 Simulation-DSPL 的 RoboCup@Home JapanOpen。自 2017 年以来,它一直定期参加 RoboCup@Home 联赛,并将参加 RoboCup 2024,展示其最新开发和研究成果。除了 RoboCup,该团队还参加了 2018 年和 2020 年世界机器人挑战赛 (WRC) 以及伙伴机器人挑战赛 (真实空间) 的服务机器人类别。HMA 专注于机器人视觉系统的开发,特别是用于训练对象识别系统的数据集生成系统。它还开发了用于原始任务的库,包括对象识别、抓取点估计和导航。任务规划是他们最新感兴趣的主题,它使用大型语言模型 (LLM) 通过在动态环境中选择原始任务来规划任务。