引入AWS批处理支持亚马逊萨吉式制造商培训工作

aws批次现在与亚马逊萨吉式制造商培训工作无缝集成。在这篇文章中,我们讨论了管理和确定ML培训工作以有效地用于您的业务的好处。我们还引导您了解如何开始使用这种新功能并分享建议的最佳实践,包括使用萨吉式培训计划。

来源:亚马逊云科技 _机器学习
图片以下图片:您的机器学习(ML)团队有一个有前途的模型来训练和实验,以便为其生成AI项目运行,但他们正在等待GPU的可用性。 ML科学家花时间监视实例可用性,与队友在共享资源上进行协调,并管理基础架构分配。同时,您的基础架构管理员花费大量时间尝试最大化利用率并最大程度地减少导致成本效益的空闲实例。这不是一个独特的故事。我们从客户那里听说,他们没有管理自己的基础架构和工作订购,而是想要一种方法来排队,提交和重试培训工作,同时使用Amazon Sagemaker AI进行模型培训。WAWS批次现在与Amazon Sagemaker培训工作无缝集成。这种集成提供了智能的作业计划和自动化资源管理,同时保留了您团队熟悉的完全管理的sagemaker体验。 ML科学家现在可以更多地专注于模型开发,而不是基础设施协调。同时,您的组织可以优化昂贵的加速实例的使用,提高生产率和降低成本。下面的示例来自丰田研究所(TRI):“有多种大型行为模型(LBM)进行培训,我们需要一个复杂的工作调度系统。AWSBatch的优先排队,并结合了Sagemaker AI培训工作,使我们的研究人员可以动态地调整他们的培训能力,并确定其优先级别的跨度型号,并确定了跨越的跨度,并跨越了多种型号,并保持了多种多样的需求,并且可以保持多种多样的需求。对于TRI:我们保持了灵活性和速度,同时负责资源的负责管家。” - 信息工程总监Pet Richmond在本文中,我们讨论了管理和优先考虑ML培训工作的好处,以便有效地使用硬件为您的业务。我们还带您了解如何获得S