Loading...
机构名称:
¥ 1.0

摘要 - 说话者验证系统的性能可能会受到时域变化的不利影响。然而,由于没有适当的数据集,对时变的说话者的验证进行了有限的研究。本文旨在调查长期和短期时间变化在说话者验证中的影响,并提出解决这些影响的解决方案。对于长期说话者的验证(即跨年龄的说话者验证),我们引入了一种年龄段的对抗性学习方法,通过从voxceleb数据集中通过最小年龄信息来学习年龄不变的说话者的代表。对于短期演讲者的验证,我们收集了Smiip-pimevarying(SMIIP-TV)数据集,该数据集包括每天在连续90天的373位扬声器和其他相关元信息的录音中。使用此数据集,我们分析了说话者嵌入的时间变化,并提出了一种新颖但现实的时代的说话者的验证任务,称为增量序列 - 扬声器对扬声器的验证。此任务涉及注册音频和一系列测试音频之间的持续互动,目的是随着时间的推移提高性能。我们介绍了模板更新方法,以应对时间来应对负面影响,然后将模板更新处理作为马尔可夫决策过程,并提出基于深度强化学习(DRL)的模板更新方法。DRL的策略网络被视为确定是否以及应更新模板的代理。总而言之,本文释放了我们收集的数据库,研究了长期和短期时间变化的场景,并将洞察力和解决方案分解为随着时变的说话者的验证。

研究长期和短期的演讲者验证

研究长期和短期的演讲者验证PDF文件第1页

研究长期和短期的演讲者验证PDF文件第2页

研究长期和短期的演讲者验证PDF文件第3页

研究长期和短期的演讲者验证PDF文件第4页

研究长期和短期的演讲者验证PDF文件第5页