获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
一个著名的假设认为,通过用婴儿导向语音 (IDS) 而不是成人导向语音 (ADS) 与婴儿交谈,父母可以帮助他们学习语音类别。具体而言,据称 IDS 的两个特点有助于学习:过度发音,使类别更可分离,以及多变性,使泛化更具鲁棒性。在这里,我们测试了元音类别学习在日本成人用 ADS、IDS(针对 18-24 个月大的婴儿)或阅读语音 (RS) 发出的语音声学表示上的可分离性和鲁棒性。可分离性是通过计算日语的五个短元音类别之间的距离测量来确定的,而鲁棒性则通过测试六种不同的机器学习算法来评估,这些算法经过训练对元音进行分类,以泛化到 ADS 中新说话者所说的刺激。使用两种不同的语音表示,我们发现,在 RS 的情况下,高清晰度语音可以产生更好的可分离性,并且在 ADS 中,说话者之间的差异性增加可以为某些算法产生更稳健的类别。然而,这些结论并不适用于 IDS,事实证明,与 ADS 输入相比,IDS 既没有产生更可分离的类别,也没有产生更稳健的类别。我们讨论了在真实数据上运行的机器学习算法的实用性,以测试有关 IDS 功能作用的假设。