图 1:EGT 模型中的确定性最优策略。(GLY-VOP-DEF) 三角形代表各个亚群所有可能的相对丰度。由于该策略是 bang-bang 策略,我们使用黄色背景(其中应以 MTD 速率使用药物)和蓝色背景(其中根本不应使用药物)来显示它。从初始状态 (q0,p0) = (0.26,0.665)(洋红色点)开始,子图显示 (a) 从真正确定性驱动的系统 (2.14) 中找到的最优轨迹,成本为 5.13;(b) 在确定性最优策略下生成的两个代表性样本路径,但受到随机适应度扰动的影响(较亮的一个成本为 3.33,而另一个成本为 6.23); (c) 使用 10 5 个随机模拟近似的累积成本 J 的 CDF。在 (a) 和 (b) 中,轨迹的绿色部分对应于不开药,轨迹的红色部分对应于以 MTD 率开药。在 (a) 中,确定性情况下的价值函数的水平集以浅蓝色显示。在 (c) 中,蓝色曲线是使用确定性最优策略 d ⋆ 生成的 CDF。其在成功条件下观察到的中位数和平均值分别为 4.95 和 4.91。棕色曲线是使用基于 MTD 的疗法生成的 CDF,在此示例中,它还最大限度地提高了“不受预算约束”的肿瘤稳定的机会。其在成功条件下观察到的中位数和平均值分别为 5.95 和 5.96。橙色和粉色曲线显示了两种不同的阈值感知策略的 CDF(分别为 ¯ s = 4 . 5 和 ¯ s = 5)。每个曲线上的大点表示不超过相应阈值的最大化概率。术语“阈值特定优势”是指在 ¯ s 时,d ¯ s ∗ 的 CDF 高于所有其他策略的 CDF。
主要关键词