ChatGPT 可能比实习医生更擅长评估儿童复杂的呼吸系统疾病

根据在奥地利维也纳举行的欧洲呼吸学会 (ERS) 大会上公布的一项研究,ChatGPT 在评估儿童复杂呼吸系统疾病方面可能比实习医生和其他聊天机器人表现更好。研究人员使用了儿科呼吸医学中经常出现的临床场景,涵盖囊性纤维化、哮喘、睡眠呼吸障碍、呼吸困难和胸部感染等主题,以测试十名在儿科临床经验不足四个月的实习医生与 ChatGPT、谷歌的 Bard 聊天机器人和微软的 Bing 聊天机器人的能力。向聊天机器人展示了相同的场景。所有回答都由六名儿科呼吸专家评分,他们还被要求说出他们认为每个回答是人类生成的还是聊天机器人生成的。ChatGPT 提供的解决方案总体得分最高,被认为比其他聊天机器人的回答更像人类。Bard 得分第二高,得分比实习医生更“连贯”,但在其他方面,它与实习医生没有好坏之分。 Bing 的得分在聊天机器人中最低,总体而言与实习医生的得分相同。专家可靠地将 Bing 和 Bard 的回答认定为非人类。研究表明,这些大型语言模型 (LLM) 可用于支持实习医生、护士和全科医生更快地对患者进行分类并减轻医疗服务的压力。

来源:Scimex

Chatgpt可能比评估儿童复杂呼吸道疾病的学员医生和其他聊天机器人更好。研究人员使用了在小儿呼吸医学中经常发生的临床情况,涵盖了诸如囊性纤维化,哮喘,睡眠呼吸的呼吸,呼吸困难和胸部感染,以测试十名临床经验不到四个月的临床经验的学员的能力,这些临床经验不到四个月,这是针对Chatgpt,Chatgpt的Bard Chatbot和Microsoft和Microsoft和Microsoft的Batbotoft和Catchbotoft的B.聊天机器人提出了相同的方案。 所有的回答都是由六名儿科呼吸专家评分的,他们还被要求说他们是否认为每个反应都是人类或聊天机器人生成的。 Chatgpt提供的解决方案得分最高,被认为比其他聊天机器人的回应更像人性化。巴德(Bard)得分第二高,比学员的医生得分更高,但在其他方面,比学员医生更好或更糟。 Bing的得分最低,聊天机器人与总体学员医生相同。专家可靠地将Bing和Bard的反应确定为非人类。研究表明,这些大语言模型(LLMS)可用于支持受训的医生,护士和全科医生,以更快地分类患者,并减轻对卫生服务的压力。

期刊/会议:欧洲呼吸学会大会

日记/会议:

组织/S:英国儿童和年轻人皇家医院

组织/S:

媒体版本

来自:

欧洲呼吸学会大会

ChatGpt在评估儿童复杂呼吸系统疾病

这项研究还表明,在某些方面,Google的聊天机器人的表现要比受训者表现更好,而微软的Bing Chatbot也表现出来。

(结束)