Loading...
机构名称:
¥ 1.0

本研究旨在为在线资源分配问题设计一种最佳和战略性的机制。在此类问题中,消费者以任意方式随机使用其资源请求。结果,未来资源需求存在不确定性。此外,分配和付款决策取决于提供者的过去经验。为了应对这些挑战,我们提出了一种新颖的增强学习算法,以优化资源分配策略。所提出的算法采用了一种新型的单调奖励型函数,该函数使用了主要的资源多标签分类技术。最后,计算关键的支付价值,以维持在线环境中的策略性范围。实验评估表明,所提出的机制达到的结果在最佳社会福利的96%以内,同时超过了使用固定定价的其他机制。©2021由Elsevier B.V.

未来的计算机系统

未来的计算机系统PDF文件第1页

未来的计算机系统PDF文件第2页

未来的计算机系统PDF文件第3页

未来的计算机系统PDF文件第4页

未来的计算机系统PDF文件第5页