Loading...
机构名称:
¥ 1.0

抽象背景大语言模型(LLM),例如ChatGpt,对各种医疗应用都有很大的影响。但是,Chatgpt的培训主要是从以英语为中心的Internet数据中汲取的,并且并未明确针对医疗领域量身定制。因此,中国人的眼科LLM对于中国大陆的医疗保健提供者和患者至关重要。方法,我们使用中国语料库开发了眼科(MOPH)的LLM,并在三种临床方案中评估了其表现:中文的眼科董事会考试,回答了基于循证医学的循证眼镜的眼科问题和临床小插曲的诊断准确性。此外,我们将MOPH的表现与人类医生的表现进行了比较。导致眼科考试,MOPH的平均得分与受训者的平均得分(64.7(62-68)vs 66.2(范围50-92),P = 0.817)紧密排列,但在所有七个模拟考试中都取得了超过60分的分数。在回答眼科问题时,MOPH表明,按照中国指南(李克特量表4-5),遵守83.3%(25/30)的回答。审阅者将仅6.7%(2/30,李克特量表1-2)和10%(3/30,李克特量表3)评为“贫穷或非常贫穷”或“潜在误解的不准确性”。在诊断准确性中,尽管眼科医生的正确诊断率优于MOPH(96.1%vs 81.1%,P> 0.05),但差异在统计上并不显着。结论这项研究证明了在各种临床情况下MOPH(一种中文特异性眼科LLM)的有希望的表现。MOPH在中文眼科设置中具有潜在的现实应用。

中文中的大型眼科语言模型的发展和评估

中文中的大型眼科语言模型的发展和评估PDF文件第1页

中文中的大型眼科语言模型的发展和评估PDF文件第2页

中文中的大型眼科语言模型的发展和评估PDF文件第3页

中文中的大型眼科语言模型的发展和评估PDF文件第4页

中文中的大型眼科语言模型的发展和评估PDF文件第5页

相关文件推荐

2025 年
¥23.0
2021 年
¥4.0
2022 年
¥1.0
2025 年
¥11.0
1900 年
¥4.0
2025 年
¥1.0