语法作为注射型:trojan马到NLP

机器如何理解句子结构:组合性语法语法作为注射术:Trojan马到NLP的态度首先出现在数据科学上。

来源:走向数据科学

i从未如此提及的话题,这是我们如何以一种非统计的方式理解语法。许多AI模型,例如DeepMind的Gem和Google的Parseval,都不纯粹依靠统计学习来理解语法。取而代之的是,这些混合模型重新引入了形式的语法,例如组合类别语法(CCG),以其结构。这允许这些模型仅在几行代码中利用数十年的语言分析。从理论上讲,使他们能够在更少的时间和成本更少的时间内达到相同水平的能力。但是,我们如何将语法变成计算机可以使用的东西呢?

非统计 混合模型 (CCG)

要理解这一点,我们将讨论单词如何变成函数,组合背后的代数以及返回TypeError的程序在许多方面等同于具有不良语法的句子。

了解 代数

听,未定义的可能会带回一些不好的回忆 - 用红色弄脏的单词,手腕统治者或面对“介词”的空白凝视。

介词

对语法人员,这是通过一组规定的规则来帮助的。命令:

    您不愿意使用“谁”作为主题。您在句子中有一个主题和对象。
  • 您不使用“谁”作为主题。
  • 您的句子中有一个主题和一个对象。
  • 主题 对象
  • 您不会以介词(at,by,to,…)结束句子。
  • 介词

    作为作家,我总是发现诫命有点限制 - 部分疼痛,部分药物。尽管我可以承认这种语法可以澄清您的写作,但它不能帮助机器理解句子结构。为此,如果您熟悉,我们将需要讨论组合类别语法(CCG)。但是,我们不能放弃规定语法。在本文中,我们将使用第二条诫命:每个句子都必须包含一个明确的主题和谓词。

    规定语法 第二诫 谓词

    证明网

    type-1 s