量子自然语言处理中的密度矩阵方法__

量子自然语言处理中的密度矩阵方法

可下载资源数量

已经购买

下载数量：1

单价	0 9.0
Coupon	100% 0%
Total	0 9.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

量子自然语言处理中的密度矩阵方法

¥ 9.0

热度

尽管向量是计算编码单词含义最常用的结构，但它们无法表示对潜在含义的不确定性。模糊词可以通过其各种可能含义的概率分布来最好地描述。将它们放在上下文中应该可以消除其含义的歧义。同样，词汇蕴涵关系也可以使用概率分布来表征。然后，将层次顺序中较高位置的单词建模为其所包含单词含义的概率分布。DisCoCat 模型受到量子理论数学结构的启发，提出密度矩阵作为能够捕捉这种结构的词嵌入。在量子力学中，它们描述的是状态仅以不确定性已知的系统。初步实验已经证明了它们能够捕捉单词相似性、单词歧义性和词汇蕴涵结构。Word2Vec 模型的改编版 Word2DM 可以学习这种密度矩阵词嵌入。为了确保学习到的矩阵具有密度矩阵的属性，该模型学习中间矩阵并从中导出密度矩阵。这种策略导致参数更新不是最优的。本论文提出了一种用于学习密度矩阵词嵌入的混合量子-经典算法来解决这个问题。利用密度矩阵自然描述量子系统的事实，不需要中间矩阵，理论上可以规避经典 Word2DM 模型的缺点。变分量子电路的参数经过优化，使得量子比特的状态与单词的含义相对应。然后提取状态的密度矩阵描述并将其用作词嵌入。为词汇表中每个单词学习一组与其密度矩阵嵌入相对应的单独参数。在本论文中，已经在量子模拟器上执行了第一次实现。所利用的目标函数减少了同时出现的单词之间的距离，并增加了不同时出现的单词之间的距离。因此，可以通过评估学习到的词向量的相似性来衡量训练的成功程度。该模型是在词汇量较小的文本语料库上进行训练的。学习到的词向量显示了文本中单词之间的预期相似性。我们还将讨论在真实量子硬件上的实现问题，例如提取完整的状态表示和计算该模型的梯度。

添加pdf代下载 VIP点击下载文件