Loading...
机构名称:
¥ 9.0

尽管向量是计算编码单词含义最常用的结构,但它们无法表示对潜在含义的不确定性。模糊词可以通过其各种可能含义的概率分布来最好地描述。将它们放在上下文中应该可以消除其含义的歧义。同样,词汇蕴涵关系也可以使用概率分布来表征。然后,将层次顺序中较高位置的单词建模为其所包含单词含义的概率分布。DisCoCat 模型受到量子理论数学结构的启发,提出密度矩阵作为能够捕捉这种结构的词嵌入。在量子力学中,它们描述的是状态仅以不确定性已知的系统。初步实验已经证明了它们能够捕捉单词相似性、单词歧义性和词汇蕴涵结构。Word2Vec 模型的改编版 Word2DM 可以学习这种密度矩阵词嵌入。为了确保学习到的矩阵具有密度矩阵的属性,该模型学习中间矩阵并从中导出密度矩阵。这种策略导致参数更新不是最优的。本论文提出了一种用于学习密度矩阵词嵌入的混合量子-经典算法来解决这个问题。利用密度矩阵自然描述量子系统的事实,不需要中间矩阵,理论上可以规避经典 Word2DM 模型的缺点。变分量子电路的参数经过优化,使得量子比特的状态与单词的含义相对应。然后提取状态的密度矩阵描述并将其用作词嵌入。为词汇表中每个单词学习一组与其密度矩阵嵌入相对应的单独参数。在本论文中,已经在量子模拟器上执行了第一次实现。所利用的目标函数减少了同时出现的单词之间的距离,并增加了不同时出现的单词之间的距离。因此,可以通过评估学习到的词向量的相似性来衡量训练的成功程度。该模型是在词汇量较小的文本语料库上进行训练的。学习到的词向量显示了文本中单词之间的预期相似性。我们还将讨论在真实量子硬件上的实现问题,例如提取完整的状态表示和计算该模型的梯度。

量子自然语言处理中的密度矩阵方法

量子自然语言处理中的密度矩阵方法PDF文件第1页

量子自然语言处理中的密度矩阵方法PDF文件第2页

量子自然语言处理中的密度矩阵方法PDF文件第3页

量子自然语言处理中的密度矩阵方法PDF文件第4页

量子自然语言处理中的密度矩阵方法PDF文件第5页

相关文件推荐

1900 年
¥2.0
2020 年
¥1.0
2022 年
¥1.0
2025 年
¥59.0