抽象有效的问题分类对于有效的软件项目管理至关重要。但是,分配给问题的标签通常不一致,这可能会对监督分类模型的性能产生负面影响。在这项工作中,我们研究了标签一致性和培训数据大小如何影响自动问题分类。我们首先在手动验证的数据集上评估了几种弹奏学习方法,并将其与更大的人群中的微调进行比较。结果表明,在经过一致的标签上训练和测试时,我们的方法可以达到更高的准确性。然后,我们使用GPT-3.5检查零射击分类,发现尽管没有微调,但其性能与监督模型相当。这表明生成模型可以在注释数据受到限制时帮助对问题进行分类。总的来说,我们的发现提供了有关平衡数据数量和质量的见解。
主要关键词