同样,由于没有套利,对于风险资产的所有终值,两种收益都不会大于另一种。如附录 3 所示,ν T 的期望值高于 Black 和 Scholes 模型。它特别解释了为什么对于 CPPI,BS 模型的期望值高于 SV 模型(见表 1)。B. 期望值、方差、偏度和峰度的比较。处理期权时,均值-方差方法并不总是合理的,因为收益不是线性的。因此,我们同时检查前四个矩。如果我们比较前两个矩(均值-方差分析),请注意,对于 m 高,CPPI 投资组合的期望值和方差大于 OBPI 投资组合的期望值和方差,因此在均值-方差标准方面不存在优势。对于金融市场的任何参数化,至少存在一个 m 值,使得 OBPI 策略在均值-方差意义上优于 CPPI 策略。
定量市场的特征是迅速的动态和丰富的不确定性,使追求利润驱动的股票交易行动固有地具有挑战性。在这种情况下,加固学习(RL)(以奖励为中心的最佳控制机制运作)已成为对本文财务决策的潜在解决方案的潜在有效解决方案。本文深入研究了两种已建立的财务交易策略的融合,即恒定比例的投资组合保险(CPPI)和时间不变的投资组合保护(TIPP),并具有多代理的深层确定性政策级别(MADDPG)框架。因此,我们介绍了两种新型的多代理RL(MARL)方法:CPPI-MADDPG和Tipp-MADDPG,该方法量身定制,用于探索定量市场中的战略性交易。为了验证这些创新,我们以100个房地产股份的各种选择实施了它们。我们的经验发现表明,CPPI-MADDPG和TIPP-MADDPG策略始终超过其传统同行,从而确认了它们在定量交易领域的功效。