机器学习的最新进展为算法交易开辟了新的可能性,从而在复杂的市场环境中优化了交易策略。本论文旨在通过开发机器学习模型来改善算法交易方法,以实现限制顺序书籍的现实模拟和学习最佳策略。由三篇论文组成,论文结合了理论见解与实际应用。第一篇论文介绍了使用经常性神经网络的限制顺序簿的动态探索的生成模型。该模型通过将每次限制订单簿的每个过渡的概率归结为订单类型,价格水平,订单大小和时间延迟的条件概率的产品,从而捕获了限制订单簿的完整动态。这些条件概率中的每一个都是通过复发性神经网络建模的。此外,本文引入了与订单执行相关的生成模型的几个评估指标。生成模型均经过由马尔可夫模型和纳斯达克斯德哥尔摩交换的真实数据进行的合成数据训练。第二篇论文提出了一种迭代性确定性政策方法,用于金融中随机控制问题,这使临时市场和永久性市场影响不大。该方法基于派生的策略梯度定理,并使用Mini Batch随机梯度下降进行优化。它都应用于OR-der执行和选项对冲,表明了几种目标和市场动态的表现始终如一。第三篇论文研究了具有基于参数的探索的策略梯度方法,其中在情节开始时采样单个确定性策略,并在整个情节中使用。显示了基于参数的和基于操作的外观之间的边际等效性,促进了以基于动作的指示的策略梯度方法的先前建立的收敛结果的适应。在温和的假设下呈现到一阶固定点的收敛速率,并且在引入的Fisher-Non-Non-depentore条件下建立了全球收敛,以基于参数 - 基于参数。
主要关键词