摘要 - 人工智能,特别是通过深度学习的最新进步(DL),在自然语言处理和计算机视觉等领域的许多任务中都取得了出色的表现。对于某些高风险域,除了理想的性能指标外,通常还需要高水平的解释性才能可靠地使用AI。不幸的是,DL模型的黑匣子性质阻止了研究人员为DL模型的推理过程和决策提供阐释描述。在这项工作中,我们提出了一个利用对抗性逆增强学习的新颖框架,该框架可以为通过强化学习模型做出的决策提供全球解释,并捕获该模型通过总结模型的决策过程所遵循的直觉趋势。索引术语 - 对抗性逆增强学习,自然语言处理,抽象性摘要
主要关键词