5.2(a)在此模型中,我们将根据训练数据中最接近的树的类别对一棵新树进行分类。这高度取决于培训数据的选择。如果我们将数据集分为两半,并为这两个数据集中的每个数据集制作k = 1的最邻居模型,那么我们很可能会在两个模型上获得非常不同的决策界限,因为我们将预测基于单个训练数据点。这意味着我们在模型中有很大的差异。至于偏见:是高还是低取决于我们认为仅地理位置是否足以确定树类型的信息。如果是这种情况,则偏差很低,因为1-NN模型可以描述非常灵活的映射(在这种情况下,从“位置”到“树类型”)。但是,如果有有关模型中未使用的功能中可用的树类型的相关信息,则可以将其视为偏见,这是由于“真实”输入输出关系的模型不足。
主要关键词