使用 Amazon SageMaker Studio 中的 Amazon SageMaker Distribution 创建用于地理空间分析的自定义图像

这篇文章向您展示了如何使用其他依赖项扩展 Amazon SageMaker Distribution,以创建针对地理空间分析量身定制的自定义容器映像。虽然这篇文章中的示例侧重于地理空间数据科学,但所介绍的方法可以应用于基于 SageMaker Distribution 的任何类型的自定义映像。

来源:亚马逊云科技 _机器学习

Amazon SageMaker Studio 为机器学习 (ML) 提供了一套全面的完全托管的集成开发环境 (IDE),包括 JupyterLab、代码编辑器(基于 Code-OSS)和 RStudio。它支持 ML 开发的所有阶段 - 从数据准备到部署,并允许您启动预配置的 JupyterLab IDE 以在几秒钟内高效编码。此外,其灵活的界面和人工智能 (AI) 驱动的编码助手简化并增强了 ML 工作流配置、调试和代码测试。

Amazon SageMaker Studio JupyterLab 代码编辑器 RStudio

卫星图像、坐标轨迹或航拍地图等富含其他业务和环境数据集的特征或属性的地理空间数据正变得越来越可用。这为环境监测、城市规划、农业、灾害响应、交通和公共卫生等领域的宝贵用例提供了机会。

地理空间数据

为了有效地利用此类数据集中包含的大量信息进行机器学习和分析,获得正确的地理空间数据处理工具至关重要。鉴于地理空间数据通常采用专门的文件格式,例如云优化 GeoTIFF (COG)、Zarr 文件、GeoJSON 和 GeoParquet,需要专用的软件工具和库才能使用,这一点尤其重要。

云优化 GeoTIFF Zarr GeoJSON GeoParquet

为了满足 SageMaker Studio 中的这些特定需求,本文向您展示了如何使用其他依赖项扩展 Amazon SageMaker Distribution,以创建针对地理空间分析量身定制的自定义容器映像。虽然本文中的示例侧重于地理空间数据科学,但所介绍的方法可以应用于基于 SageMaker Distribution 的任何类型的自定义映像。

Amazon SageMaker 发行版 GitHub 存储库

解决方案概述

您可以按照以下步骤构建自定义容器映像并在 SageMaker Studio 中使用它:

AWS Cloud9