使用Amazon SageMaker AI管理MLFLOF

在这篇文章中,我们展示了如何将AWS DLC与MLFlow集成,以创建一个解决基础结构控制与强大ML治理的解决方案。我们将浏览您的团队可以使用的功能设置,以满足您的专业要求,同时大大减少ML生命周期管理所需的时间和资源。

来源:亚马逊云科技 _机器学习
建立自定义机器学习(ML)模型的组织通常具有标准平台无法适应的专业要求。例如,医疗保健公司需要特定的环境来保护患者数据,同时符合HIPAA合规性,金融机构需要特定的硬件配置来优化专有的交易算法,并且研究团队需要灵活地使用自定义框架尝试尖端技术。这些专门的需求驱动组织建立自定义培训环境,使他们可以控制硬件选择,软件版本和安全配置。这些自定义环境提供了必要的灵活性,但它们为ML生命周期管理带来了重大挑战。组织通常会尝试通过构建其他自定义工具来解决这些问题,而一些团队将各种开源解决方案汇总在一起。这些方法进一步增加了运营成本,并需要可以在其他地方更好地使用的工程资源。哇,深度学习容器(DLC)和Amazon SageMaker上的MLFLOW AI提供了一个强大的解决方案,可满足这两种需求。 DLC提供了预先配置的Docker容器,其中包括Tensorflow和Pytorch等框架,包括NVIDIA CUDA驱动程序以提供GPU支持。 DLC针对AWS的性能进行了优化,并定期维护以包括最新的框架版本和补丁,并旨在与AWS服务无缝集成以进行培训和推理。 AWS深度学习AMIS(DLAMIS)是亚马逊弹性计算云(Amazon EC2)实例的预先配置的亚马逊机器图像(AMIS)。 Dlamis配备了Pytorch和Tensorflow等流行的深度学习框架,可用于基于CPU的实例和高功率的GPU加速实例。它们包括Nvidia Cuda,Cudnn和其他必要工具,AWS管理Dlamis的更新。 Dlamis和DLC一起为ML从业者提供了基础设施和工具