摘要 — 新兴的实例优化系统类别已显示出通过专门针对特定数据和查询工作负载实现高性能的潜力。特别是,机器学习 (ML) 技术已成功应用于构建各种实例优化组件(例如,学习索引)。本文研究了利用 ML 技术来增强空间索引(特别是 R 树)的性能,以适应给定的数据和查询工作负载。由于 R 树索引节点覆盖的区域在空间中重叠,因此在搜索空间中的特定点时,可能会探索从根到叶的多条路径。在最坏的情况下,可以搜索整个 R 树。在本文中,我们定义并使用重叠率来量化范围查询所需的无关叶节点访问程度。目标是提高传统 R 树对高重叠范围查询的查询性能,因为它们往往会产生较长的运行时间。我们引入了一种新的 AI 树,将 R 树的搜索操作转换为多标签分类任务,以排除无关的叶节点访问。然后,我们将传统的 R 树扩展到 AI 树,形成混合的“AI+R”树。“AI+R”树可以使用学习模型自动区分高重叠查询和低重叠查询。因此,“AI+R”树使用 AI 树处理高重叠查询,使用 R 树处理低重叠查询。在真实数据集上的实验表明,“AI+R”树可以将查询性能提高到传统 R 树的 500% 以上。
主要关键词