Loading...
机构名称:
¥ 3.0

乘车共享公司等双面市场通常涉及一组主题,这些主题在跨时间和/或政策中做出顺序决策。随着智能手机和物联网的快速发展,它们实质上改变了人类的运输格局。在本文中,我们考虑了乘车共享公司中的大规模车队管理,这些公司涉及随着时间的推移,在不同领域接收产品序列(或治疗)的多个单位。在这些研究中出现了主要的技术挑战,例如政策评估,是因为(i)空间和时间代理会引起位置和时间之间的干扰; (ii)大量位置导致维度的诅咒。为了同时解决这两个挑战,我们引入了在这些研究中进行政策评估的多代理强化学习(MARL)框架。,我们提出了新的估计量,以确保不同产品下的平均结果,尽管州行动空间的高度差异很高。在模拟实验中提出的估计量有益。我们使用从双面覆盖的公司获得的实际数据集进一步进一步,以评估应用不同的补贴策略的效果。我们提出的方法的Python实现可在https://github.com/runzhestat/causalmarl上获得。

我们如何改善次级CVD预防LSE_EFPIA

我们如何改善次级CVD预防LSE_EFPIAPDF文件第1页

我们如何改善次级CVD预防LSE_EFPIAPDF文件第2页

我们如何改善次级CVD预防LSE_EFPIAPDF文件第3页

我们如何改善次级CVD预防LSE_EFPIAPDF文件第4页

我们如何改善次级CVD预防LSE_EFPIAPDF文件第5页