面对新的预测或分类任务时,最明显的是哪种机器学习算法最适合。一种常见的方法是评估一组机器学习者在数据的保留分区或通过交叉验证的性能,然后选择最小化所选损失指标的机器学习者。但是,这种方法是不完整的,因为将多个学习者组合为一个最终预测可能会导致与每个学习者相比,可能会导致卓越的表现。这种可能性激发了堆积的概括,或者只是“堆叠”(参见Wolpert [1992]和Breiman [1996])。堆叠是模型平均形式。Van der Laan,Polley和Hubbard(2007)的理论结果支持堆叠的使用,因为它至少是渐近的,并且只要基础学习者的数量不大。
主要关键词