聚类分析的目的是找到相似的观察结果组。例如,有了客户购买习惯数据库,零售商可能希望将具有相似购买模式的客户归为一组。有了这些组,就可以进行进一步的分析。聚类分析首先要衡量两个观察结果的相似性或差异性。然后将最相似的观察结果聚类在一起。在本文档中,我们介绍了两种形式的聚类分析,即 k 均值(第 1.2 节)和层次聚类(第 1.3 节)。在第 1.4 节中,我们描述了一种呈现层次聚类分析结果的图形方法,称为树状图。第 2.1 节中描述的案例研究给出了使用其中一些技术进行聚类分析的示例。聚类分析期间定义的组可用于提供对感兴趣的数据集的一些见解,或可用作其他分析技术的输入,例如判别分析。
主要关键词