SoundCTM关键词检索结果

采访Yuki Mitsufuji:文本到听觉的一代

Interview with Yuki Mitsufuji: Text-to-sound generation

今年早些时候,我们与索尼AI的主要研究科学家Yuki Mitsufuji谈了有关图像产生不同方面的工作。从那以后,Yuki和他的团队将其工作扩展到了Sound Generation,在ICLR 2025上展示了题为:SoundCTM的工作:统一基于得分和一致性模型,用于全频段的文本对单抗一代。我们赶上了Yuki […]