Loading...
机构名称:
¥ 1.0

数据不平衡,也称为数据的长尾分布,是数据驱动模型的重要挑战。在“意义上的歧义”(WSD)任务中,单词感官分布的长尾现象更为普遍,这使得很难有效地表示和识别长尾感官(LTSS)。因此,探索不严重依赖训练样本量的表示形式是对抗LTSS的重要方法。考虑到许多新状态,即叠加状态,可以从量子力学中的几个已知状态构建,因此超级态态提供了从从较小的样本量中学到的下较低表示中获得更准确的表示的可能性。受量子叠加状态的启发,提出了一种在希尔伯特空间中的表示方法,以赋予对大样本量的依赖性,从而使LTSS对抗。理论上证明了该方法的正确性,并在标准WSD评估框架下验证其有效性并获得最新性能。fur-hoverore,我们还测试了构建的LT和最新的跨语言数据集,并取得了令人鼓舞的结果。

量子启发的表示,用于长尾词感官歧义

量子启发的表示,用于长尾词感官歧义PDF文件第1页

量子启发的表示,用于长尾词感官歧义PDF文件第2页

量子启发的表示,用于长尾词感官歧义PDF文件第3页

量子启发的表示,用于长尾词感官歧义PDF文件第4页

量子启发的表示,用于长尾词感官歧义PDF文件第5页

相关文件推荐