分类任务出现在人类的各种活动中。从最广泛的意义上讲,这个术语可以涵盖基于当前可用信息做出某些决策或预测的任何情况,而分类程序则是在新情况下重复做出此类判断的某种正式方法。在本书中,我们将考虑一种更为严格的解释。我们假设问题涉及构建一个程序,该程序将应用于连续的案例序列,其中每个新案例都必须根据观察到的属性或特征分配给一组预定义的类别之一。从一组已知真实类别的数据中构建分类程序的过程也被不同地称为模式识别、鉴别或监督学习(以将其与无监督学习或从数据中推断类别的聚类相区别)。分类任务是基础的环境包括,例如,根据机器读取的邮政编码对字母进行分类的机械程序,根据财务和其他个人信息对个人进行信用状况分配,以及对患者疾病进行初步诊断以便在等待最终测试结果时选择立即治疗。事实上,科学、工业和医疗领域中出现的一些最紧迫的问题