使用自动机构优化AI实施成本

在这篇来宾帖子中,我们解释了AWS合作伙伴如何帮助其客户实现超过十二倍的成本节省,同时将AI模型的性能保持在所需的性能阈值范围内。这是通过仔细调整体系结构,算法选择和基础架构管理来实现的。

来源:亚马逊云科技 _机器学习

这篇文章是由Claudiu Bota,Oleg Yurchenko和AWS合作伙伴Automat-It的Vladyslav Melnyk撰写的。

这篇文章是由Claudiu Bota,Oleg Yurchenko和AWS合作伙伴Automat-It的Vladyslav Melnyk撰写的。

随着组织采用AI和机器学习(ML),他们正在使用这些技术来改善流程并增强产品。 AI用例包括视频分析,市场预测,欺诈检测和自然语言处理,都依赖于有效分析数据的模型。尽管模型在几乎没有延迟的情况下达到了令人印象深刻的准确性,但它们通常要求具有重要的计算能力(包括GPU)的计算资源来运行推断。因此,保持绩效和成本之间的适当平衡至关重要,尤其是在大规模部署模型时。

机器学习

我们的客户之一遇到了这个确切的挑战。为了解决这个问题,他们聘请了AWS Premier Tier合作伙伴Automat-It来设计和在AWS上实施其平台,特别是使用Elastic Kubernetes Service(Amazon EKS)。 Automat-It专门通过动手云DevOps,MLOPS和Finops服务来帮助初创企业和规模增长。该协作旨在在优化成本的同时实现可扩展性和性能。他们的平台需要具有较低延迟的高度准确的模型,并且在没有适当优化的情况下,此类苛刻任务的成本迅速升级。

automat-it 弹性Kubernetes服务(Amazon EKS)

在这篇文章中,我们解释了自动机构如何帮助该客户实现超过十二倍的成本节省,同时将AI模型性能保持在所需的性能阈值之内。这是通过仔细调整体系结构,算法选择和基础架构管理来实现的。

客户挑战

我们的客户专门使用Yolov8和Ultrytics库开发用于视频智能解决方案的AI模型。端到端的yolov8部署包括三个阶段:

yolov8 预处理 推理 后处理 2.7 7.9