使用 Almond 内核在 Amazon SageMaker Studio 中进行 Scala 开发

本文提供了有关将 Almond 内核集成到 SageMaker Studio 的综合指南,为平台内的 Scala 开发提供了解决方案。

来源:亚马逊云科技 _机器学习
Scala 是一种结合了面向对象和函数式编程方法的多功能编程语言。通过在 Java 虚拟机 (JVM) 上运行,它保持与 Java 库的无缝兼容性,同时提供简洁且可扩展的开发体验。该语言在分布式计算和大数据处理领域脱颖而出,使用 Scala 构建的 Apache Spark 框架是其功能的一个典型例子。尽管 Amazon SageMaker Studio 为基于 Python 的数据科学和机器学习 (ML) 工作流程提供全面支持,但它不包含对 Scala 开发的内置支持。这种集成对于使用 Spark 或从事复杂数据处理任务的人员来说特别有价值,因为它支持无缝的基于 Scala 的探索性分析和开发以及 Amazon SageMaker 中以 Python 为中心的工具。 Almond 内核的添加扩展了 SageMaker Studio 的多功能性,因此团队可以在利用该服务的 ML 和云计算功能的同时,维护其首选的 Scala 工作流程。在混合语言环境中工作的组织和团队,特别是那些大量投资于基于 Scala 和 Spark 的数据处理工作流程的组织和团队,在使用 SageMaker Studio 时面临挑战,因为它没有内置的 Scala 支持。当前的流程要求开发人员维护单独的环境或使用变通办法,从而扰乱工作流程并降低生产力。喜欢 Scala 强类型和函数式编程的数据科学家和工程师必须适应 Python 或切换平台,从而增加开发开销并冒生产管道不一致的风险。此外,为大数据处理构建了广泛的 Scala 代码库的团队在尝试将现有工作与 SageMaker 的 ML 功能集成时面临额外的复杂性,这会减慢高级 ML 功能的采用或需要 addit