这项研究调查了大型语言模型用于测试案例生成的利用。该研究使用Llama提供的大型语言模型和嵌入模型,特别是7B尺寸的Llama2,以生成定义输入的测试用例。这项研究涉及一种使用称为检索产生(RAG)和及时工程的自定义技术的信息。rag是本研究中在本地存储组织信息的一种方法,该信息用于创建测试用例。除了大型语言模型已准备好培训的预训练数据外,该存储的数据被用作互补数据。通过使用此方法,实现可以收集特定的组织数据,因此对所需域有更深入的了解。该研究的目的是研究AI驱动的测试案例生成如何影响整体软件质量和开发效率。这是通过比较基于AI的系统的输出与手动创建测试用例来评估的,因为这是研究时的公司标准。AI驱动的测试用例主要以覆盖范围和时间的形式进行分析,这意味着我们比较了AI系统可以生成测试用例与手动创建的测试案例相比。同样,考虑时间来了解如何影响发展效率。
主要关键词