获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
Chat-GPT-4、AMBOSS 用户和 Chat-GPT-3.5 的准确率分别为 71.33%、54.38% 和 46.23%。在比较模型时,GPT-4 有了显着的改进,与 GPT-3 相比,准确率提高了 25%,试验间一致性提高了 8%(p<.001)。GPT 模型在第 1 步和第 2 步内容之间的性能相似。GPT-3.5 和 GPT-4 的表现因医学主题而异(p=.027,p=.002)。但是,没有明显的变化模式。随着问题难度的增加,GPT 模型和 AMBOSS 用户的性能均下降(p<.001)。但是,GPT-4 的准确率下降不太明显。与 AMBOSS 用户相比,GPT 模型的准确率随问题难度的变化较小,从最简单问题到最难问题的准确率平均分别下降 45% 和 62%。