dynamollm：设计LLM推理群集的性能和能源效率__

dynamollm：设计LLM推理群集的性能和能源效率

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

dynamollm：设计LLM推理群集的性能和能源效率

¥ 1.0

热度

摘要 - 生成大语言模型（LLM）的快速发展和广泛采用使它们成为各种应用程序中的关键工作量。今天，LLM推理群集会收到大量具有严格服务级别目标（SLO）的查询。为了达到所需的性能，这些模型在渴望的GPU上执行，从而导致Interence簇消耗大量能量，并且因此导致过多的碳发射。幸运的是，我们发现有一个很好的机会来利用推理计算属性和推理工作载荷中的波动的异质性，以显着提高能源效率。但是，如此多样化且动态的环境在不同的系统配置中创建了一个较大的搜索空间（例如，，实例数量，模型并行性和GPU频率）转化为不同的绩效权衡。为了应对这些挑战，我们提出了Dynamollm，这是LLM推理环境的第一个能源管理框架。dynamollm会自动，动态地重新配置推理群集，以优化服务性能SLO下的LLM服务的能量和成本。我们表明，在服务级别，Dynamollm可以保留53％的能源和38％的运营碳排放，并在满足潜伏期SLOS的同时，为客户降低了61％的成本。

添加pdf代下载 VIP点击下载文件

dynamollm：设计LLM推理群集的性能和能源效率

主要关键词

级别所需的大量具有大量环境 LLM 提高过多的多样化能量并行性碳排放推理排放动态的系统配置应用程序动态不同的挑战较大的工作量 Dynamollm 异质性工作载潜伏期服务服务的搜索空间能源管理工作载荷环境的应对 GPU 模型 SLO

dynamollm：设计LLM推理群集的性能和能源效率PDF文件第1页

dynamollm：设计LLM推理群集的性能和能源效率PDF文件第2页

dynamollm：设计LLM推理群集的性能和能源效率PDF文件第3页

dynamollm：设计LLM推理群集的性能和能源效率PDF文件第4页

dynamollm：设计LLM推理群集的性能和能源效率PDF文件第5页

可下载资源数量

已经购买

下载数量：1

dynamollm：设计LLM推理群集的性能和能源效率

dynamollm：设计LLM推理群集的性能和能源效率

相关文件推荐

交互式设计以鼓励办公室的能源效率

设计建造服务以提高能源效率和……

改进工艺设计，提高能源效率

对能源效率和

住宅能源效率

电气系统中的能源效率

安大略省的能源效率

能源效率局（BEE）能源效率局（BEE）

centerachAdapt：通过LLM推理

能源效率资源

建筑能源效率

工业部门的能源效率

能源效率 - 欧盟

能源转型费率设计

能源效率委员会

可再生能源和能源效率

商业能源效率

东南部的能源效率

过程控制和能源效率

能源效率和NDC：

能源效率与保护法

能源效率与节约

能源效率的愿景

能源效率法案

能源效率法案

国家能源效率战略

航空运输和能源效率

基于性能的建筑设计

设计基于LLM的学习助手

能源效率和需求分子

XiaoMi-AI