ChatGPT-4o 和 Google Gemini 对与避孕相关的查询提供了高质量的回答,总分平均分别为 4.38 ± 0.58 和 4.37 ± 0.52,均被归类为“非常好”到“优秀”。根据描述性统计数据,ChatGPT-4o 在缺乏虚假信息方面表现出更高的分数(4.70 ± 0.60 vs. 4.47 ± 0.73),而 Google Gemini 在相关性方面表现更佳,具有统计学上的显着差异(4.53 ± 0.57 vs. 4.30 ± 0.70,p = 0.035,效果大小大)。完整性得分相当(p = 0.655)。统计分析显示总体表现没有显着差异(p = 0.548),但 Google Gemini 在“其他主题”类别中表现出更强的表现趋势。模型内变异性表明,ChatGPT-4o 在指标之间的差异更明显(中等效应大小,Kendall 的 W = 0.357),而 Google Gemini 的变异性较小(Kendall 的 W = 0.165)。这些发现表明,这两个平台都提供了可靠且互补的工具来解决避孕方面的知识差距,其细微的优势值得进一步探索。
主要关键词