Loading...
机构名称:
¥ 1.0

在许多应用中,尤其是在生物医学和气候研究中,可访问数据的数量和多样性已经达到了前所未有的水平,提供了一个独特的机会,可以深入了解这些复杂系统。但是,这种数据激增带来了重大挑战。的确,现代数据科学的特征越来越多地是对高维多模式数据集进行的研究,在这些数据集中,每个数据样本的几个特征可能无关紧要(例如,由于腐败或其他特征组合的线性相关性而导致的),或者是在分辨率和收购策略中的多样性策略来构建策略的多样性。例如,最近,艾伦·图灵研究所(Alan Turing Institute)举办了一系列的研讨会,分析了丢失数据的性质,并指出它可以归因于各种现象,包括多模式链接,批处理失败或人口异质性[8]。为了表征和解决现代数据集的挑战,已经开发了各种数据表示,包括低维投影,矩阵分解和图表表示。尤其是,图形嵌入被证明是一个非常强大的工具,可以编码拓扑网络信息,并提供有关基础数据几何形状的见解。由于图可以被视为平滑歧管的离散(零维)对应物,因此可以将图形嵌入被视为降低歧管维度降低的特殊情况,也称为歧管学习。图形嵌入在首先通过学习/构造足够的图表表示,然后将其投影到较低维度的几何空间,通常是歧管,例如欧几里得空间(R n)或超纤维空间。在过去20年中,流形学习取得了重大进步,导致了能够嵌入复杂几何形状和非线性关系的广泛有效方法的发展,尤其是ISOMAP [12],T-SNE [13]和UMAP [7]。最近,出现了新的流形学习策略,该策略并不依赖于数据位于submanifold上的假设,即所谓的“流动假设”,而是通过做出嵌入流层的前提选择来明确地将学习/归纳偏见编纂。这些最新的嵌入旨在匹配成对距离,并且在嵌入式上呈弯曲的曲率与节点的曲率信息匹配。以这种方式,所得的下二歧管嵌入能够总结嵌入式节点的配置以及图结构属性。值得注意的是,它们在多样化的研究领域中得到了相当成功的运用[9、5、14、10、3、4],因为它们使我们能够利用图理论,拓扑数据分析和差异几何形状中的工具来促进各种任务的完成,包括链接预测,网络重构,网络重构和node Clustering [2]。

几何形状的数据表示

几何形状的数据表示PDF文件第1页

几何形状的数据表示PDF文件第2页

几何形状的数据表示PDF文件第3页

几何形状的数据表示PDF文件第4页