决策树是众所周知的预测模型,常用于数据挖掘和机器学习的广泛应用 [1-3]。一般来说,决策树可以看作是一种流程图结构,可用于查询数据。从根开始,每个内部节点代表对查询数据的测试,每个传出分支代表此测试的可能结果。对于二叉树,测试结果是一个布尔值,因此可以是真也可以是假(即每个内部节点有两个分支)。树的每个叶子都可以与一个决策相关联。因此,从根到叶子的路径意味着一组针对查询数据的决策规则,就像一个顺序决策过程。具体来说,我们考虑二叉分类树,其中叶子的决策决定了数据点对预定义的离散类集的成员资格。从给定数据集推断决策树是一项监督机器学习任务,也称为决策树归纳(或决策树学习)。然而,寻找全局最优解是 NP 难问题 [4, 5],因此启发式递归算法在实践中更受青睐 [6]。此类算法通常以贪婪的自上而下的方式工作 [7]:从根开始,通过最小化数据不纯度函数来估计每个内部节点的最佳测试。相应地,沿着两个传出分支将数据集分成两个子集。对每个内部节点递归重复此过程,直到停止标准终止树的遍历并产生一个叶子节点,该叶子节点的分类决策基于节点内数据子集中存在的多数类。当所有路径都通向叶子节点时,算法结束。启发式创建的决策树并不能保证全局最优,但可能仍然适合实际用途。在量子计算的背景下,决策树可以被分配到量子机器学习领域 [8]。之前的几篇论文考虑了决策树和量子计算之间的相互作用。在 [9] 中,研究了决策树的遍历速度,并比较了经典方法和量子方法。作者发现两者之间没有优势。[10] 提出了一种启发式算法来诱导量子分类树,其中数据点被编码为量子态,并使用测量来找到最佳分割。然而,部分算法
主要关键词