研究人员开发工具来即时隐藏和匿名化声音

语音转换器系统将在几毫秒内产生计算机生成的语音,允许用户控制年龄、性别和方言等因素。

来源:罗切斯特大学

语音转换器系统将在几毫秒内生成计算机生成的语音,允许用户控制年龄、性别和方言等因素。

研究人员正在开发一种新系统,该系统将允许人们通过计算机生成的声音实时匿名讲话,以帮助保护隐私并避免审查或报复。 该技术旨在帮助执行敏感任务的情报人员、担心被犯罪者识别的犯罪目击者以及担心遭到报复的举报人。

该项目为期三年,由霍尼韦尔牵头,包括罗切斯特大学、德克萨斯农工大学和德克萨斯大学达拉斯分校的合作者,由情报高级研究计划活动 (IARPA) 资助,是匿名实时语音 (ARTS) 计划的一部分。

罗切斯特大学 匿名实时语音 (ARTS) 项目

语音转换器项目有三个主要目标。首先,该系统将在几毫秒内将用户所说的话转换为数字语音,确保可用于实时对话。其次,该团队旨在允许用户指定他们所谓的静态特征,从而控制数字语音的年龄、性别和方言。最后,他们希望消除他们所谓的动态特征,例如情绪或健康状况,这些特征可能会泄露用户的身份。

“最终,一位来自德克萨斯州的 30 岁女性将能够立即将她的声音转换为虚拟扬声器输出的声音,听起来像一位 50 岁、带有英国口音的男性,而不会产生可以追溯到用户身份的伪像,”电气和计算机工程副教授、罗切斯特大学项目负责人段志耀说道。“除了延迟要求外,我们还将努力确保计算机生成语音的清晰度和自然度。”

段志耀 电气和计算机工程