如何使用 EDG 和 Neo4j 构建基于图形的推荐引擎

使用共享分类法连接 RDF 和属性图,并通过推理提供更智能的推荐如何使用 EDG 和 Neo4j 构建基于图的推荐引擎一文首先出现在 Towards Data Science 上。

来源:走向数据科学

在本教程中,我将向您展示如何在 EDG 中管理分类并将其发布到 Neo4j 实例,在该实例中可以填充其他数据以支持推荐引擎。在 TopQuadrant 的 EDG 中构建和维护的分类定义了结构。一组(假的)学术期刊文章用作填充 Neo4j 的实例数据。我将使用 STEM 类别的小型层次结构作为分类法来组织文章。该数据包含在知识共享 CC0 1.0 通用公共领域奉献中。

TopQuadrant 的 Neo4j 此数据 知识共享 CC0 1.0 通用公共领域奉献

注 1:全面披露 - 我在 TopQuadrant 工作,这家公司是 EDG 的开发者,所以我自然偏向于我熟悉的工具。 Neo4j和TopQuadrant的EDG都是商业产品,不是开源的。它们均提供适合跟随本教程学习的免费试用版本:Neo4j 提供一个免费的云数据库实例(对数据量、内存和 CPU 存在限制),而 TopQuadrant 提供 EDG Desktop 的 90 天免费试用版。此外,虽然此处概述的架构有其优点,但它并不是唯一的方法,而且这些供应商也不是唯一能够支持此类工作流程的供应商。下面列出了这种方法的优点和缺点。

注1:

注 2:这是该演示的视频录制。

注2: 这里

注3:本文中的所有图片均由作者创建。

注3: 数学软件 计算机科学 科学、技术和数学 (STEM)

我们将有关单个文章内容的实例级信息与有关主题本身及其相互关系的元信息分开。

您想要使用这种架构进行构建的原因是:

推理: 对齐多个系统: GraphDB 变更管理: 数学 计算机科学, 数学软件。 发挥工具的优势: 对于简单用例来说太过分了: 技能和学习曲线: 更多活动部件: 供应商锁定: SPARQL W3C RDF SHACL 维基数据 要点 SNOMED MedDRA 这个 这里