详细内容或原文请订阅后点击阅览
嵌入图集:低摩擦、交互式嵌入可视化
嵌入投影通常用于可视化大型数据集和模型。然而,人们在使用嵌入可视化工具时经常遇到“摩擦”:(1)采用障碍,例如繁琐的数据整理和加载、可扩展性限制、无法将结果集成到现有工作流程中,以及(2)可能的分析限制,无法与外部工具集成以额外显示元数据的协调视图。在本文中,我们介绍了 Embedding Atlas,这是一种可扩展的交互式可视化工具,旨在尽可能轻松地与大型嵌入进行交互......
来源:Apple机器学习研究嵌入投影通常用于可视化大型数据集和模型。然而,人们在使用嵌入可视化工具时经常遇到“摩擦”:(1)采用障碍,例如繁琐的数据整理和加载、可扩展性限制、无法将结果集成到现有工作流程中,以及(2)可能的分析限制,无法与外部工具集成以额外显示元数据的协调视图。在本文中,我们介绍了 Embedding Atlas,这是一种可扩展的交互式可视化工具,旨在尽可能轻松地与大型嵌入进行交互。 Embedding Atlas 使用现代网络技术和先进算法(包括基于密度的聚类和自动标记)来提供快速、丰富的大规模数据分析体验。我们通过与其他流行嵌入工具的竞争分析来评估 Embedding Atlas,结果表明 Embedding Atlas 的功能集特别有助于减少摩擦,并报告了其实时渲染性能的基准(数百万个点)。 Embedding Atlas 作为开源提供,以支持基于嵌入的分析的未来工作。
