Berne关键词检索结果

走向数据科学

2026年6月14日 13:00

Kubernetes 上并发 LLM 代理的 GPU 时间切片

GPU Time-Slicing for Concurrent LLM Agents on Kubernetes

系统级深入探讨 Kubernetes GPU 时间切片的隐藏微架构成本，以及共置 Agentic AI 工作负载的实际成本。Kubernetes 上并发 LLM 代理的 GPU 时间切片后文章首先出现在《走向数据科学》上。

走向数据科学

2026年5月19日 18:14

在 Amazon Elastic Kubernetes Service 上部署多阶段多模式推荐系统

Deploying a Multistage Multimodal Recommender System on Amazon Elastic Kubernetes Service

在 Amazon EKS 上构建和部署多级多模态推荐系统的实用演练，涵盖数据管道、模型训练、布隆过滤器、特征缓存和实时排名。在 Amazon Elastic Kubernetes Service 上部署多级多模态推荐系统一文首先出现在 Towards Data Science 上。

1