How Omada Health scaled patient care by fine-tuning Llama models on Amazon SageMaker AI
本文由 Omada Health 的 AI/ML 产品经理 Sunaina Kavi 共同撰写。 Omada Health 是虚拟医疗服务领域的长期创新者,于 2025 年推出了新的营养体验,其特色是 OmadaSpark,这是一款接受过强大临床输入训练的人工智能代理,可提供实时动机访谈和营养教育。它是在 AWS 上构建的。 OmadaSpark 的设计 [...]
使用几行代码即可将量化模型无缝部署在 Amazon SageMaker AI 上。在这篇文章中,我们探讨了为什么量化很重要——它如何实现更低成本的推理,支持在资源受限的硬件上的部署,并减少现代法学硕士对财务和环境的影响,同时保留其大部分原始性能。我们还深入研究 PTQ 背后的原理,并演示如何量化您选择的模型并将其部署在 Amazon SageMaker 上。
How Beekeeper optimized user personalization with Amazon Bedrock
Beekeeper 的自动排行榜方法和用于动态法学硕士和即时配对选择的人工反馈循环系统解决了组织在快速发展的语言模型领域面临的关键挑战。
这篇文章是通过 AWS 与 Instituto de Ciência e Tecnologia Itaú (ICTi)(ICTi)(由拉丁美洲最大的私人银行 Itaú Unibanco 维护的 P&D 中心)之间的战略科学合作伙伴关系开发的,探讨了文本和音频情绪分析的技术方面。我们展示了比较多种机器学习 (ML) 模型和服务的实验,讨论了每种方法的权衡和陷阱,并重点介绍了如何编排 AWS 服务来构建强大的端到端解决方案。我们还提供对未来潜在方向的见解,包括针对大型语言模型 (LLM) 的更先进的提示工程,以及扩大基于音频的分析范围以捕获仅文本数据可能会错过的情感线索。
Architecting TrueLook’s AI-powered construction safety system on Amazon SageMaker AI
本文详细介绍了 TrueLook 如何使用 SageMaker AI 构建人工智能驱动的安全监控系统,重点介绍了关键技术决策、管道设计模式和 MLOps 最佳实践。您将获得有关在 AWS 上设计可扩展计算机视觉解决方案的宝贵见解,特别是围绕模型训练工作流程、自动化管道创建和实时推理的生产部署策略。
Migrate MLflow tracking servers to Amazon SageMaker AI with serverless MLflow
本文向您展示如何将自我管理的 MLflow 跟踪服务器迁移到 MLflow 应用程序 - SageMaker AI 上的无服务器跟踪服务器,可根据需求自动扩展资源,同时免费消除服务器修补和存储管理任务。了解如何使用 MLflow 导出导入工具传输实验、运行、模型和其他 MLflow 资源,包括验证迁移是否成功的说明。
Build an AI-powered website assistant with Amazon Bedrock
本文演示了如何通过使用 Amazon Bedrock 和 Amazon Bedrock 知识库构建人工智能驱动的网站助手来解决这一挑战。
Programmatically creating an IDP solution with Amazon Bedrock Data Automation
在本文中,我们将探讨如何以编程方式创建使用 Strands SDK、Amazon Bedrock AgentCore、Amazon Bedrock 知识库和 Bedrock Data Automation (BDA) 的 IDP 解决方案。该解决方案通过 Jupyter 笔记本提供,使用户能够上传多模式业务文档并使用 BDA 作为解析器提取见解,以检索相关块并增强对基础模型 (FM) 的提示。
AI agent-driven browser automation for enterprise workflow management
企业组织越来越依赖基于 Web 的应用程序来执行关键业务流程,但许多工作流程仍然需要大量手动操作,从而造成运营效率低下和合规风险。尽管技术投资巨大,但知识工作者仍会在标准工作流程中在八到十二个不同的 Web 应用程序之间进行导航,不断切换上下文并在系统之间手动传输信息。数据输入和验证任务 [...]
Exploring the zero operator access design of Mantle
在这篇文章中,我们将探讨 Amazon Bedrock 的下一代推理引擎 Mantle 如何实现零操作员访问 (ZOA) 设计,消除 AWS 操作员访问客户数据的任何技术手段。
AWS AI League: Model customization and agentic showdown
在这篇文章中,我们探讨了新的 AWS AI League 挑战以及它们如何改变组织进行 AI 开发的方式。 AWS re:Invent 2025 的压轴戏精彩地展示了他们的独创性和技能。
Accelerate Enterprise AI Development using Weights & Biases and Amazon Bedrock AgentCore
在这篇文章中,我们演示了如何使用 Amazon Bedrock 的基础模型 (FM) 和新推出的 Amazon Bedrock AgentCore 以及 W&B Weave 来帮助构建、评估和监控企业 AI 解决方案。我们涵盖从跟踪单个 FM 调用到监控生产中复杂的代理工作流程的完整开发生命周期。
How dLocal automated compliance reviews using Amazon Quick Automate
在这篇文章中,我们将分享 dLocal 如何与 AWS 团队密切合作,帮助制定产品路线图、强化其作为行业创新者的角色,并为全球金融科技领域的卓越运营树立新的基准。
在这篇文章(三篇系列文章中的第一篇)中,我们重点介绍如何使用 Amazon Nova 通过生成式 AI 来简化和加速营销活动的创建。我们展示了哥伦比亚最大的银行之一 Bancolombia 如何尝试使用 Amazon Nova 模型为其营销活动生成视觉效果。
在这篇文章中,我们将探讨 AWS 和 Visa 如何合作,使用 Amazon Bedrock AgentCore 通过 Visa 智能商务来实现代理商务。我们展示了自主人工智能代理如何将碎片化的购物和旅行体验转变为无缝的端到端工作流程——从发现和比较到安全支付授权——所有这些都是由自然语言驱动的。
Move Beyond Chain-of-Thought with Chain-of-Draft on Amazon Bedrock
本文探讨了 Chain-of-Draft (CoD),这是 Zoom AI Research 论文 Chain of Draft: Thinking Faster by Write Less 中引入的一种创新提示技术,它彻底改变了模型处理推理任务的方式。虽然思维链 (CoT) 提示一直是增强模型推理的首选方法,但 CoD 提供了一种更有效的替代方案,反映了人类解决问题的模式——使用简洁、高信号的思维步骤,而不是冗长的解释。
Deploy Mistral AI’s Voxtral on Amazon SageMaker AI
在本文中,我们演示了使用 vLLM 和自带容器 (BYOC) 方法在 Amazon SageMaker AI 终端节点上托管 Voxtral 模型。 vLLM 是一个用于服务大型语言模型 (LLM) 的高性能库,具有分页注意力以改进内存管理和张量并行性,以便跨多个 GPU 分发模型。
在这篇文章中,我们通过对亚马逊运营中心内的制造设备进行案例研究,展示了如何在 Amazon Bedrock 上使用基础模型 (FM) 实施预测性维护解决方案。该解决方案具有高度适应性,可以针对其他行业进行定制,包括石油和天然气、物流、制造和医疗保健。