论文讨论了由于模型范式和培训数据的拟合度较差,将深入强化学习应用于盘中市场的挑战。它提出了可能的解决方案的结果要求,并提出了一种理论解决方案以及开发过程。通过在高性能群集上使用开发的Python软件包进行的实验显示了满足要求的程度。用收集的数据进一步分析了实施的主要要求,即实施的运行时性能。用法的讨论旨在确定成功实施的程度。积极的结果已经被发现,可以根据历史数据模拟在平均运行时平均运行时的平均运行历史记录中的35,000个离散事件。合成数据是在此过程中生成的,并用于训练深层神经网络。也提出了训练过程中运行时使用的分布和并行性的缩放。
主要关键词