摘要 - 函数-AS-A-Service(FAAS)引入了一个轻巧的,基于功能的云执行模型,该模型在诸如IOT-EDGE数据处理和异常检测等一系列应用程序中找到了相关性。虽然云服务提供商(CSP)提供了近乎无限的功能弹性,但这些应用程序通常会遇到波动的工作负载和更严格的性能限制。典型的CSP策略是基于基于监视的阈值(例如CPU或内存)来确定和调整所需的功能实例或资源,称为自动化,以应对需求和性能。但是,阈值配置需要专家知识,历史数据或对环境的完整视图,从而使自动化的性能瓶颈缺乏适应性的解决方案。强化学习(RL)算法被证明有益于分析复杂的云环境,并导致适应性的政策,从而最大程度地提高了预期目标。最现实的云环境通常涉及操作干扰,并且可见度有限,使它们部分可观察到。在高度动态的设置中解决可观察性的一般解决方案是将复发单元与无模型的RL算法集成,并将决策过程建模为部分可观察到的马尔可夫决策过程(POMDP)。因此,在本文中,我们研究了用于功能自动化的无模型复发剂,并将其与无模型近端策略优化(PPO)算法进行比较。我们探讨了长期术语内存(LSTM)网络与最先进的PPO算法的集成,以发现在我们的实验和评估设置下,经常性的策略能够捕获环境参数并显示出有希望的函数自动效果的结果。我们进一步将基于PPO的自动化剂与商业使用的基于阈值的函数自动化和认为,基于LSTM基于LSTM的自动体现剂能够将吞吐量提高18%,功能执行13%,占8.4%的功能实例。