Loading...
机构名称:
¥ 1.0

在本文中,我们借助于验证的语言模型研究了改进的命名者认同。首先,我们尝试了一种有监督的方法,其中每个说话者在训练数据中的话语的内容用于验证基于编码器的BERT风格的语言模型。接下来,我们探讨了大型生成语言模型,证明了他们在文本成绩单中执行零摄像人识别的能力。在两种情况下,我们都会尝试两种语言,包括Voxceleb1扬声器标识数据集和三个爱沙尼亚广播新闻和对话数据集。我们表明,大型语言模型可以在对话演讲中为命名者的识别表现提供戏剧性的证明,在这些演讲中,用他们的名字介绍说话者。此外,OpenAI GPT-4模型有时会通过人类的表现来回忆《爱沙尼亚人的说话者》成绩单。

使用验证的语言模型进行改进的扬声器识别

使用验证的语言模型进行改进的扬声器识别PDF文件第1页

使用验证的语言模型进行改进的扬声器识别PDF文件第2页

使用验证的语言模型进行改进的扬声器识别PDF文件第3页

使用验证的语言模型进行改进的扬声器识别PDF文件第4页

使用验证的语言模型进行改进的扬声器识别PDF文件第5页

相关文件推荐

2024 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0