点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要。是在增强学习中的剥削和勘探之间的权衡中的动机,我们研究了在跳跃存在下的连续时间熵调节的均值变化投资组合选择。我们为与表现出L'evy跳跃的多个风险资产相关的财富过程提供了探索性SDE。与现有文献相反,我们研究了与随机控制的财富过程的自然离散时间公式的限制行为,以得出连续的时间动力学。然后,我们表明,尽管处于跳跃模型中,但仍对连续时间熵进行的探索均值变化问题的最佳分布控制仍然是高斯。此外,各自的最佳财富过程求解了一个线性SDE,其表示明确获得。
主要关键词