Run small language models cost-efficiently with AWS Graviton and Amazon SageMaker AI
在这篇文章中,我们通过将预建的容器扩展到与AWS Graviton实例兼容,演示了如何在Sagemaker AI上部署小语言模型。我们首先提供解决方案的概述,然后提供详细的实施步骤以帮助您入门。您可以在GitHub存储库中找到示例笔记本。
Unlocking the power of Model Context Protocol (MCP) on AWS
,由于生成AI公司投资开发其产品,我们已经见证了模型能力的显着进步。诸如Anthropic的Claude Opus 4&Sonnet 4和Amazon Nova之类的语言模型可以推理,写作并产生越来越复杂的响应。但是,即使这些模型变得更强大,它们也只能起作用[…]
Build a scalable AI assistant to help refugees using AWS
丹麦人道主义组织贝瓦尔乌克兰(Bevar Ukraine)开发了一个综合的虚拟生成性AI驱动的助手,名为Victor,旨在满足乌克兰难民的紧迫需求,这些难民将整合到丹麦社会中。本文详细介绍了我们使用AWS服务的技术实施,以创建可扩展的多语言AI助手系统,该系统在维护数据安全和GDPR合规性的同时提供自动帮助。
May Recap: New AWS Services and Privileged Permissions
2025年5月结束时,我们又回到了AWS特权许可更新和服务级别的最新综述,以重塑云安全性。跟踪这些变化至关重要,因为新引入的权限通常可以深入访问关键服务,这是针对横向移动,数据暴露和逃避安全控制的风险的门。 […]
Architect a mature generative AI foundation on AWS
在这篇文章中,我们概述了建立了良好的生成AI基础,深入研究了其组成部分,并提出了端到端的视角。我们查看不同的操作模型,并探讨了这些基础如何在这些边界内运作。最后,我们提出了一个成熟模型,该模型可帮助企业评估其演化路径。
Revolutionizing earth observation with geospatial foundation models on AWS
在这篇文章中,我们探讨了如何将领先的GeoFM(Clay Foundation的Clay Foundation模型在拥抱面上可用)如何用于大规模推断和在Amazon Sagemaker上进行微调。
AI驱动的购物助理 Rufus依靠许多组件来提供其客户体验,包括Foundation LLM(响应生成)和查询计划者(QP)模型,以进行查询分类和检索增强。这篇文章的重点是QP模型如何使用以平行解码为中心的投机解码(SD)(SD)以及AWS AI芯片来满足Prime Day的需求。通过将平行解码与AWS Trainium和推理芯片相结合,Rufus的响应时间更快,推理成本降低了50%,并且在高峰流量期间无缝可扩展性。 在这篇文章中,我们向您展示了如何实施和评估三种强大的技术,以根据您的业务需求来量身定制FMS:抹布,微调和混合方法,结合了这两种方法。我们提供现成的代码,以帮助您尝试这些方法,
Transforming LLM Performance: How AWS’s Automated Evaluation Framework Leads the Way
大语言模型(LLMS)正在迅速改变人工智能(AI)的领域,从客户服务聊天机器人到高级内容生成工具。随着这些模型的规模和复杂性的增长,确保其产出始终是准确,公平和相关的变得更具挑战性的。为了解决此问题,AWS的自动评估框架提供了[…]转换LLM绩效的帖子:AWS的自动化评估框架如何首先出现在Unite.ai上。
GuardianGamer scales family-safe cloud gaming with AWS
在这篇文章中,我们分享了GuardianGamer如何使用AWS服务,包括Amazon Nova和Amazon Bedrock来提供可扩展有效的监督平台。该团队使用亚马逊Nova进行聪明的叙事生成,为父母提供对孩子的游戏活动和社交互动的有意义的见解,同时保持了非侵入性的监测方法。
AWS machine learning supports Scuderia Ferrari HP pit stop analysis
维修人员经过培训,以最佳的效率运行,尽管衡量其性能一直具有挑战性。在这篇文章中,我们分享了亚马逊Web服务(AWS)如何帮助Scuderia Ferrari HP使用机器学习(ML)开发更准确的距离停止分析技术。
Accelerate edge AI development with SiMa.ai Edgematic with a seamless AWS integration
在这篇文章中,我们演示了如何使用SageMaker AI和Sima.ai Palette软件套件对模型进行重新训练和量化。目的是准确检测个人在可见性和保护设备检测对于合规性和安全性至关重要的环境中。
7 AWS Services for Machine Learning Projects
了解AWS机器学习服务,该服务可帮助您构建机器学习管道,从处理数据到培训和部署模型。
Cost-effective AI image generation with PixArt-Σ inference on AWS Trainium and AWS Inferentia
这篇文章是我们将在Trainium和推断供电的实例上运行多个扩散变压器的系列中的第一篇文章。在这篇文章中,我们展示了如何将Pixart-Sigma部署到训练和推断供电的实例中。
Cost-effective AI image generation with PixArt-Sigma inference on AWS Trainium and AWS Inferentia
这篇文章是我们将在Trainium和推断供电的实例上运行多个扩散变压器的系列中的第一篇文章。在这篇文章中,我们展示了如何将Pixart-Sigma部署到训练和推断供电的实例中。
Pause Your ML Pipelines for Human Review Using AWS Step Functions + Slack
通过插入快速,安全的人体检查中的机器学习管道中建立信任。在使用AWS步骤函数 + Slack暂停您的ML Pupeeline for Munth Pipeelines,首先出现在数据科学上。
Analyze resource-based policy dependencies across your AWS Organizations accounts
管理组织中的多个AWS帐户可能会变得复杂,尤其是在尝试了解如何连接服务和权限时。 AWS组织开源工具的帐户评估可以通过为您提供评估和管理所有帐户的中心地点来帮助简化此过程。现在,您可以从基于Web的界面中运行自动扫描,而无需在各个帐户上手动审查资源,而是可以进行数小时的时间。该工具可帮助您找到诸如…更多→邮政分析AWS组织帐户的基于资源的策略依赖性之类的东西,首先出现在帮助网络安全性上。
WordFinder app: Harnessing generative AI on AWS for aphasia communication
在这篇文章中,我们展示了Kori Ramajoo博士,Sonia Brownset博士,来自Qarc的David Copland教授和患有失语症的人Scott Harding如何使用AWS服务来开发Wordfinder,这是一种基于云的移动性,基于云的解决方案,可帮助患有APHASIA的个人通过使用AWS Generative AI Generative AI技术来增强其独立性。
在这篇文章中,我们展示了如何使用Amazon Q业务与JIRA Integration创建应用程序,该应用程序使用包含可信赖顾问详细报告的数据集。该解决方案演示了如何使用Amazon Q业务(例如Amazon Q Business)的新生成AI服务来更快地获得数据见解并使其可行。