掌握 t-SNE:理解和在 Python 中实现的综合指南

通过分步 Python 实现和深入解释,释放 t-SNE 可视化高维数据的强大功能。继续阅读 Towards Data Science »

来源:None

掌握T-SNE:Python中理解和实施的综合指南

通过逐步实现和深入解释,解锁T-SNE可视化高维数据的功能。

MartinDörsch Unplash

如果要训练健壮的机器学习模型,则需要许多维度的大数据集以识别足够的结构并提供最佳的预测。但是,这种高维数据很难可视化和理解。这就是为什么需要减小尺寸的方法来可视化复杂的数据结构并执行分析的原因。

T分布的随机邻居嵌入(T-SNE/TSNE)是一种降低方法,基于数据点之间的距离和在较低维度中维持这些距离的尝试。这是一种来自无监督学习领域的方法,也能够分离非线性数据,即不能除以行的数据。

无监督的学习

为什么需要降低尺寸?

各种算法(例如线性回归)如果数据集包含相关的变量(即彼此依赖),则存在问题。为了避免此问题,从关联的数据集中删除变量……

线性回归 相关