数据不平衡,也称为数据的长尾分布,是数据驱动模型的重要挑战。在“意义上的歧义”(WSD)任务中,单词感官分布的长尾现象更为普遍,这使得很难有效地表示和识别长尾感官(LTSS)。因此,探索不严重依赖训练样本量的表示形式是对抗LTSS的重要方法。考虑到许多新状态,即叠加状态,可以从量子力学中的几个已知状态构建,因此超级态态提供了从从较小的样本量中学到的下较低表示中获得更准确的表示的可能性。受量子叠加状态的启发,提出了一种在希尔伯特空间中的表示方法,以赋予对大样本量的依赖性,从而使LTSS对抗。理论上证明了该方法的正确性,并在标准WSD评估框架下验证其有效性并获得最新性能。fur-hoverore,我们还测试了构建的LT和最新的跨语言数据集,并取得了令人鼓舞的结果。
心理语言学研究使用眼动追踪来表明多义词与同音词的消歧方式不同,歧义动词的消歧方式与歧义名词不同。组合分布语义学的研究使用余弦距离来表明动词在主语和宾语的上下文中比单独使用时更有效地消歧。这两个框架都一次关注一个歧义词,都没有考虑包含两个(或更多)歧义词的歧义短语。我们借用了量子信息论、默认语境性框架和语境影响程度的方法和指标,并研究英语的歧义主谓和动宾短语,其中主语/宾语和动词都是歧义的。我们表明,可以使用上下文影响程度的平均值来建模歧义动词和歧义名词的处理差异,以及同音词和多义词和动词的不同歧义程度之间的差异。
无纠缠非局域性 (NLWE) 是多部分可分离状态的量子态鉴别中发生的一种非局域现象。在正交可分离状态的鉴别中,当无法通过局部操作和经典通信完美区分量子态时,使用术语 NLWE。在这种情况下,NLWE 的发生与正在制备的量子态的非零先验概率无关。最近发现,在非正交可分离状态的最小误差鉴别中,NLWE 的发生可能取决于非零先验概率。在这里,我们表明,即使在最佳无歧义鉴别中,NLWE 的发生也可能取决于非零先验概率。我们进一步表明,即使只有一个状态可以无误差地进行局部鉴别,NLWE 也可以与非零先验概率无关地发生。我们的结果为根据量子态鉴别对多部分量子态集进行分类提供了新的见解。
4。†这些作者为这项工作做出了同样的贡献。pt开发了14个研究的概念框架。pt,PK和HR设计了实验。PK和PWD进行了15个实验。PK和MG分析了数据。所有作者都为16个结果和写作的解释做出了贡献。17