摘要:本文讨论了一种使用原始构造语法 (CG) 格式的知识来深入理解文本的 AI 实现。CG 是一种处理知识片段(又称构造)的方法,这些知识片段描述了文本部分的形式和含义。理解在于自动在文本中查找构造所包含的知识,并创建反映文本信息结构的知识网络。通过在网络内传播知识可以实现更深入的理解,即一些构造可以与其他构造共享有关语法、语义、语用和其他文本属性的信息。这种信息丰富的方法的一个缺点是覆盖范围有限:只能理解 CG 数据库可用的文本;由于该数据库的复杂性,通常需要手动构建。作者尝试通过从外部(非 CG)知识库等来源自动获取词汇知识并将知识格式化为 CG 构造来增加覆盖率。由此产生的 CG 数据库已用于评估实验,以了解 Winograd 模式(WS)——一种 AI 测试。准确覆盖率增加了 28%,并且有进一步改进的机会。