背景:家庭健康史(FHX)是对一个人遗传风险的重要预测指标,但在美国许多成年人并未收集。目的:本研究旨在测试和比较2种基于Web的方法的可用性,参与度和报告收集FHX的有用性。方法:此混合方法研究使用基于流的聊天机器人(套件;好奇的交互式测试)和基于表单的方法比较了FHX数据收集。套件的设计经过优化,以减轻用户负担。我们从2个众包平台招募和随机个人到2种FHX方法中的1种。所有参与者都被要求填写问卷,以评估该方法的可用性,报告的有用性,总结了他们的经验,用户呈现的聊天机器人增强功能以及一般用户体验。参与度。我们使用定性发现分析自由文本评论来补充主要定量结果。结果:随机分配到套件的参与者比随机分配到形式的参与者高,平均系统可用性量表得分分别为80.2对61.9(p <.001)。参与分析反映了入职过程中的设计差异。套件用户花费的时间少于输入FHX信息并报告的条件比表单用户多(平均5.90 vs 7.97 min; p = .04;和平均7.8 vs 10.1条件; p = .04)。套件和形式用户在某种程度上同意该报告很有用(李克特量表评级分别为4.08和4.29)。定性分析显示套件和基于表格的方法的正和负特征。在所需的增强功能中,个性化是最高的功能(188/205,91.7%的中等优先级至高优先级)。在随机分配给套件的受访者中,大多数表明它易于使用和导航,并且他们可以响应并了解用户提示。负面评论涉及套件的个性,对话节奏和管理错误的能力。对于套件和形式的受访者,定性结果揭示了共同的主题,包括希望更多有关条件的信息以及对多项选择按钮响应格式的相互欣赏。受访者还表示,他们想报告超出Kit提示(例如个人健康历史)的健康信息,并要求Kit提供更多个性化的答复。结论:我们表明套件提供了一种可用的收集FHX的方法。我们还确定了设计注意事项,以改善基于聊天机器人的FHX数据收集:首先,应增强FHX收集经验的最终报告,以为患者提供更多价值。第二,入职聊天机器人提示可能会影响数据质量,应仔细考虑。最后,我们强调了几个领域,可以通过从基于流的聊天机器人转变为大型语言模型实施策略来改善这些领域。
1 宾夕法尼亚大学佩雷尔曼医学院生物统计学、流行病学和信息学系,宾夕法尼亚州费城 19104,美国;duongtra@usna.edu(DD-T.);jiongc@seas.upenn.edu(JC);sumita.garai@pennmedicine.upenn.edu(SG);fredxu@seas.upenn.edu(FHX);jingxuan.bao@pennmedicine.upenn.edu(JB)2 美国海军学院数学系,马里兰州安纳波利斯 21402,美国 3 普渡大学数学系,印第安纳州西拉斐特 47907,美国; rkaufman@math.purdue.edu 4 宾夕法尼亚大学工程与应用科学学院生物工程系,宾夕法尼亚州,PA 19104,美国 5 乔治梅森大学电气与计算机工程系,弗吉尼亚州费尔法克斯 22030,美国;xwang64@gmu.edu 6 瑞士联邦理工学院洛桑 Neuro-X 研究所,瑞士日内瓦 1015 7 日内瓦大学放射学和医学信息学系,瑞士日内瓦 1211 8 劳伦斯利弗莫尔国家实验室计算工程部,加利福尼亚州利弗莫尔 94550,美国;kaplan7@llnl.gov 9 CENTAI 研究所,意大利都灵 10138; giovanni.petri@nulondon.ac.uk 10 伦敦东北大学网络科学研究所 NPLab,英国伦敦 E1W 1LP 11 IMT 卢卡研究所网络部,意大利卢卡 55100 12 普渡大学综合神经科学研究所,美国印第安纳州西拉斐特 47907;jgonicor@purdue.edu 13 普渡大学工业工程学院,美国印第安纳州西拉斐特 47907 14 普渡大学韦尔登生物医学工程学院,美国印第安纳州西拉斐特 47907 15 耶鲁大学公共卫生学院,美国康涅狄格州新黑文 06520;yize.zhao@yale.edu * 通信地址:li.shen@pennmedicine.upenn.edu † 上述作者对本文的贡献相同。