审查需求的动态库存优化

一个带有贝叶斯学习的顺序决策框架首先出现在数据科学方面。

来源:走向数据科学

在不确定性下。不仅是一次,而且随着时间的流逝。我们依靠我们过去对未来的经验和期望,使最明智和最佳的选择成为可能。

想想提供多种产品的业务。这些产品是以一定的代价购买的,并出售了以获利。但是,未售出的库存可能会产生补货费,可能具有打捞价值,或者在某些情况下必须完全报废。

业务面临一个关键问题:库存多少?在需求完全知道之前,必须经常做出这个决定。也就是说,在审查的需求下。如果企业积累,则观察到全部需求,因为所有客户请求均已满足。但是,如果它进行了研究,它只会看到需求超过供应,而实际需求仍然未知,这使其成为审查的观察结果。

作者通过dall-e

这种类型的问题通常称为新闻企业模型。在运营研究和应用数学等领域中,通过将其作为经典报纸的库存问题来研究了最佳的库存决定。因此,名字。

新闻供应商模型

在本文中,我们探讨了在不确定性下用于放养问题的顺序决策框架,并使用贝叶斯学习开发动态优化算法。

顺序决策

我们的方法紧密遵循沃伦·B·鲍威尔(Warren B.

Warren B. Powell,强化学习与随机优化(2019) Negoescu,Powell和Frazier(2011),新闻企业问题的最佳学习政策,审查需求和无法观察的销售

问题设置

需求率 平均需求
作者的图像
概率密度函数

顺序决策公式

最佳策略

\ [

\]

n