在本文中,我们提出了一个预测定向灰盒模糊测试器 DeepGo,它可以结合历史和预测信息来引导 DGF 通过最佳路径到达目标站点。我们首先提出路径转换模型,该模型将 DGF 建模为通过特定路径转换序列到达目标站点的过程。突变产生的新种子将导致路径转换,而高奖励路径转换序列对应的路径表示通过它到达目标站点的可能性很高。然后,为了预测路径转换和相应的奖励,我们使用深度神经网络构建虚拟集成环境 (VEE),它逐渐模仿路径转换模型并预测尚未采取的路径转换的奖励。为了确定最佳路径,我们开发了一个强化学习模糊测试 (RLF) 模型来生成具有最高序列奖励的转换序列。RLF 模型可以结合历史和预测的路径转换来生成最佳路径转换序列,以及指导模糊测试突变策略的策略。最后,为了练习高奖励路径转换序列,我们提出了行动组的概念,全面优化模糊测试的关键步骤,实现高效到达目标的最优路径。我们在 2 个基准测试套件(共 25 个程序,100 个目标站点)上对 DeepGo 进行了测试。实验结果表明,与 AFLGo、BEACON、WindRanger 和 ParmeSan 相比,DeepGo 在到达目标站点方面分别实现了 3.23 倍、1.72 倍、1.81 倍和 4.83 倍的加速比,在暴露已知漏洞方面分别实现了 2.61 倍、3.32 倍、2.43 倍和 2.53 倍的加速比。