详细内容或原文请订阅后点击阅览
Speaker-ipl:使用基于I-矢量的伪标签
使用当前迭代的改进模型为下一次迭代提供伪标记 - 已被证明是提高说话者表示质量的有力方法。 IPL在无监督的说话者识别中的最新应用是从非常复杂的自我监管方法(例如Dino)中提取的表示开始。但是,培训如此强大的自我监督模型并不是直接的(它们需要高参数调整,并且可能不会推广到室外数据),而且可能不是……
来源:Apple机器学习研究使用当前迭代的改进模型为下一次迭代提供伪标记 - 已被证明是提高说话者表示质量的有力方法。 IPL在无监督的说话者识别中的最新应用是从非常复杂的自我监管方法(例如Dino)中提取的表示开始。但是,训练这种强大的自我监督模型并不是一件直接的(它们需要高参数调整,并且可能无法推广到室外数据),而且可能根本不需要。为此,我们表明,简单,经过充分研究和建立的I-vetory生成模型足以引导IPL过程,以无监督的说话者表示。我们还系统地研究了其他组件对IPL过程的影响,其中包括初始模型,编码器,增强器,簇数和聚类算法。值得注意的是,我们发现,即使使用i-vector(例如I-vector)的简单且明显较弱的初始模型,IPL仍然可以实现与最新方法相匹配的扬声器验证性能。