点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
1 我们假设该问题为马尔可夫决策过程,而不是部分可观察的马尔可夫决策过程(即允许客户特征任意依赖于历史数据,而不是马尔可夫决策过程)。该过程的客户特征满足马尔可夫性质,因此该假设是合理的,因为公司可以整合一整套观察到的特征,从而有效地总结长期历史,而不是仅仅依赖于前一时期的行为。例如,在我们的实证环境中,我们考虑了样本期开始时的游戏行为、过去一周的行为以及前一天的行为。
主要关键词