背景:外行可以通过大语言模型(LLM)(例如ChatGpt和搜索引擎(例如Google))轻松访问健康信息。搜索引擎改变了健康信息访问,LLMS为回答Laypeople的问题提供了新的途径。目标:我们旨在比较对LLM和搜索引擎的使用频率和态度,以及它们的比较相关性,有用性,易用性以及对健康查询的响应。方法:我们进行了筛查调查,以比较寻求健康信息的LLM用户和非用户的人口统计学,并通过逻辑回归分析结果。邀请筛查调查的LLM用户进行后续调查,以报告他们寻求的健康信息的类型。我们使用ANOVA和Tukey Post hoc测试比较了LLM和搜索引擎的使用频率。最后,配对样本Wilcoxon测试将LLM和搜索引擎比较了感知的有用性,易用性,可信度,感受,偏见和拟人化。结果:总计,2002年的美国参与者在多产的情况下招募了有关使用LLM和搜索引擎的筛查调查。,参与者中有52%(n = 1045)是女性,平均年龄为39岁(SD 13)年。参与者为9.7%(n = 194),12.1%(n = 242)黑色,73.3%(n = 1467)白人,1.1%(n = 22)西班牙裔,3.8%(n = 77)是其他种族和种族。此外,1913年(95.6%)使用搜索引擎查找健康查询,而LLMS的642(32.6%)。男性使用LLM的健康问题比女性更高(1.63,1.63,95%CI 1.34-1.99; p <.001)。黑色(或1.90,95%CI 1.42-2.54; p <.001)和亚洲(或1.66,95%CI 1.19-2.30; p <.01)个体的几率比白人个体更高。那些感知到健康的人(OR 1.46,95%CI 1.1-1.93; p = .01)的人比健康状况良好的人更有可能使用LLM。更高的技术能力提高了LLM使用的可能性(OR 1.26,95%CI 1.14-1.39; P <.001)。在对281名LLM用户健康的后续调查中,大多数参与者首先使用搜索引擎(n = 174,62%)来回答健康问题,但第二个最常见的第一个咨询者是LLMS(n = 39,14%)。llms被认为是有用的(p <.01)且相关性较小(p = .07),但引起了较少的负面感觉(p <.001),看起来更人性化(llm:n = 160,vs search:n = 32),被视为较小的偏见(p <.001)。信任(p = .56)和易用性(p = .27)没有差异。结论:搜索引擎是健康信息的主要来源;然而,对LLM的积极看法表明使用日益增长。未来的工作可以通过补充外部参考和限制有说服力的语言来遏制过分依赖的答案来探讨LLM信任和有用性是否得到增强。与卫生组织的合作可以帮助提高LLMS健康产出的质量。
