视觉语言模型在包括自动驾驶在内的各个领域都感兴趣,计算机视觉技术可以准确地检测道路使用者,但是车辆有时无法理解上下文。这项研究检查了GPT-4V在预测人类评估的交通图像中“风险”水平的有效性。我们使用了从移动车辆拍摄的210张静态图像,每辆车先前由大约650人进行评级。基于心理测量构建理论并使用来自自洽性提示方法的见解,我们提出了三个假设:(i)在有效的条件下重复提示提示提示提示提高有效性,(ii)在使用单个提示和(III)中,与对象分析相比,与单个提示相比,将总分数变化并提取总分来提高有效性,以及与对象分析相比,与对象分析相比,与构成,相比,与构成的特征,相比,与构成的特征相比,与构成的特征相比,与之相比,将其与单个提示相比,相比之下。提高模型的有效性。的有效性。结果证实了这三个假设。最终的有效性系数为r = 0.83,表明可以使用具有高度准确性的AI预测人口水平的人类风险。这些发现表明,必须以相当于人类填写多项目问卷的方式提示GPT-4V。
主要关键词