摘要 - 流体天线系统(FAS)的出现提供了一种新颖的技术,用于获得空间多样性和利用干扰淡出在多源场景中共享的频谱共享 - 一种被称为流动天线多访问的范式(FAMA)。然而,随着用户数量的增加,干扰能力会降低。为了克服这一点,优先考虑强大用户的机会主义安排被证明是增强FAMA的有效方法。本文介绍了一种弹性的分散增强学习(RL)方法,用于opporistic Fama(O-fama),以自主选择强大的用户和每个选择的用户的FAS的端口共同选择网络总数。为了在这个多代理环境中提高学习效率,我们提出了一个新颖的团队理论RL框架,其中包括一个导数网络,指导每个解决方案的策略网络的多代理学习。我们的仿真结果证实了所提出方法的有效性。