8 这甚至是大数据的主要特征之一,也是神经网络等技术特别闪耀的地方。一般来说,分类模型的预测能力会随着变量数量的增加而增加,直到一定点之后,预测能力就会下降——这种现象称为休斯峰(Koutroumbas,2008),与“维数灾难”有关。降维实际上是机器学习中一个非常常见的问题(Shaw,2009)。9 泛化能力和预测偏差是设计和调整预测模型时需要平衡的两个关键标准。泛化与模型的方差成反比,因此这种套利被称为偏差-方差权衡:低偏差通常与训练和测试数据的高性能相关,而低方差意味着模型可以很好地泛化到新数据。
主要关键词