摘要 — 机器学习社区对微分几何的应用兴趣日益浓厚。然而,由于缺乏参考实现,相关几何计算的采用受到了阻碍。这种实现通常应允许用户:(i) 通过实践方法获得微分几何概念的直觉,而传统教科书通常不提供这种直觉;(ii) 无缝运行几何机器学习算法,而无需深入研究数学细节。为了解决这一问题,我们介绍了开源 Python 包 geomstats,并介绍了依赖于它的微分几何和几何机器学习算法(几何学习)的实践教程。代码和文档:github.com/geomstats/geomstats 和 geomstats.ai。
我们介绍了 Geomstats,这是一个开源 Python 包,用于对非线性流形(例如双曲空间、对称正定矩阵空间、变换李群等)进行计算和统计。我们提供面向对象且经过大量单元测试的实现。流形配备了黎曼度量系列以及相关的指数和对数映射、测地线和并行传输。统计和学习算法提供了对流形进行估计、聚类和降维的方法。所有相关操作都被矢量化以用于批量计算,并为不同的执行后端提供支持——即 NumPy、PyTorch 和 TensorFlow。本文介绍了该软件包,将其与相关库进行了比较,并提供了相关的代码示例。我们表明,Geomstats 提供了可靠的构建块,既可以促进微分几何和统计学的研究,又可以使黎曼几何在机器学习应用中的使用更加民主化。源代码可根据 MIT 许可证在 geomstats.ai 上免费获取。
我们介绍了 Geomstats,一个用于非线性流形计算和统计的开源 Python 工具箱,例如双曲空间、对称正定矩阵空间、变换李群等等。我们提供面向对象且经过广泛单元测试的实现。除此之外,流形还配备了黎曼度量族,以及相关的指数和对数映射、测地线和并行传输。统计和学习算法提供了在流形上进行估计、聚类和降维的方法。所有相关操作都被矢量化以用于批量计算,并为不同的执行后端提供支持,即 NumPy、PyTorch 和 TensorFlow,从而实现 GPU 加速。本文介绍了该软件包,将其与相关库进行了比较,并提供了相关的代码示例。我们表明,Geomstats 提供了可靠的构建块来促进微分几何和统计学的研究,并使黎曼几何在机器学习应用中的使用更加民主化。源代码可根据 MIT 许可证在 geomstats.ai 上免费获取。
7 新软件、平台、开放数据 9 7.1 新软件. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ................. ... . ... ... 13 7.1.10 Fed-BioMed . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .................................................................................................................................................................................................................................................. 14 7.1.13 SimulAD ........................................................................................................................................................................................................................................................................................................ ........................................................................................................................................................................................................................ 15 7.2 开放数据........................................................................................................................................................................................................................................................................................................................ ........................................................................................................................................................................................................ 15 7.2 开放数据........................................................................................................................................................................................................................................................................................................................................................ .... .... .... .... 15
分析非欧几里得数据(例如图形和树木)需要(特定)数学机械,因为与欧几里得空间相比,它们较不富裕或光滑的riemannian歧管。这些空间仍然可以利用后者的丰富结构。例如,图形空间是由置换组赋予Frobenius度量的矩阵,Billera-Holmes-Vogtmann(BHV)空间层是Eu-Clidean,而Wald空间嵌入在对称正极(SPD)矩阵的空间中。我们提出了一个Python软件包,用于分析生活在地球公制空间中的数据 - 拓扑空间,配备了度量和地球函数,其中度量是最短的大地测量长度连接两个点的长度。我们根据点,点集和使用地球公制空间理论构建的度量的包装结构描述了包装结构,并提供了三个实现示例。该软件包是作为GeomStats Python软件包的插件实现的,允许用户以理论上一致的方式访问和调整可用的几何和数据分析工具,以实现强烈非欧盟数据。代码是单位测试和记录的。关键字:测量公制空间; BHV空间;树值数据;图值数据;几何数据分析。