为机器提供有关世界实体及其关系的全面知识,这是AI的长期目标。在过去的十年中,大规模的知识库(也称为知识图)自动从Web内容和文本源构建,并已成为搜索引擎的关键资产。可以利用此机器知识来解释新闻,社交媒体和网络表中的文本短语,并有助于答案,自然语言处理和数据分析。本文调查了创建和策划大型知识基础的基本概念和实用方法。它涵盖了发现和规范实体及其语义类型的模型和方法,并将其组织成干净的分类法。最重要的是,本文讨论了以实体为中心属性的自动提取。为了支持长期生命周期和机器知识的质量保证,该文章介绍了构建开放式模式和知识策划的方法。有关学术项目和工业知识图的案例研究补充了概念和方法的调查。
主要关键词