详细内容或原文请订阅后点击阅览
随机簇嵌入——一种可视化大数据集的新方法
研究人员设计了一种新的 AI 算法,旨在以尽可能清晰、易于观察和人类理解的方式可视化数据簇和其他宏观特征。
来源:Qudata随机聚类嵌入——一种可视化大数据集的新方法
人类大脑的一个惊人特征是能够在大量视觉信息中发现差异。在研究大量数据时,这种能力非常有用,因为数据内容必须压缩成人类智能可以理解的形式。对于可视化分析,降维问题仍然是主要问题。
来自阿尔托大学和赫尔辛基大学芬兰人工智能中心 (FCAI) 的科学家进行了一项研究,他们测试了最著名的可视化分析方法的功能,发现当数据量显着增加时,它们都不起作用。例如,当观测次数达到数十万时,t-SNE、LargeViz 和 UMAP 方法无法再区分数据中观测的极强信号分组。t-SNE、LargeViz 和 UMAP 方法不再正常工作。
研究研究人员开发了一种新的非线性降维方法,称为随机聚类嵌入(SCE),用于更好的聚类可视化。它旨在尽可能清晰地可视化数据集,旨在以尽可能独特、易于观察和人类理解的方式可视化数据聚类和其他宏观特征。SCE 使用类似于现代人工智能方法的图形加速来计算神经网络。
希格斯玻色子的发现是该算法发明的基础。与之相关的实验的数据集包含超过 1100 万个特征向量。这些数据需要方便、清晰的可视化。这激发了科学家们开发一种新方法。
该方法的代码在 github 上公开提供。
github