详细内容或原文请订阅后点击阅览
RadiologyLlama-70B:放射学报告的新语言模型
RadiologyLlama-70B 是一种先进的 AI 模型,经过超过 650 万份医疗报告的训练,可增强对放射学发现的分析。该模型可以显著改善放射科医生的工作流程,在降低计算成本的同时提供卓越的准确性。
来源:QudataRadiologyLlama-70B:一种用于放射学报告的新语言模型
佐治亚大学和麻省总医院 (MGH) 的研究人员开发了一种专门的语言模型 RadiologyLlama-70B,用于分析和生成放射学报告。该模型基于 Llama 3-70B 构建,在大量医学数据集上进行训练,在处理放射学发现方面表现出色。
RadiologyLlama-70B
背景和意义
放射学研究是疾病诊断的基石,但不断增长的成像数据量给放射科医生带来了巨大压力。人工智能有可能减轻这种负担,提高效率和诊断准确性。RadiologyLlama-70B 标志着将人工智能融入临床工作流程的关键一步,从而实现放射学报告的简化分析和解释。
训练数据和准备
该模型在一个包含来自 MGH 的 650 多万份患者医疗报告的数据库中进行训练,涵盖 2008 年至 2018 年。据研究人员称,这些综合报告涵盖了各种成像方式和解剖领域,包括 CT 扫描、MRI、X 射线和荧光透视成像。
数据集包括:
- 放射科医生的详细观察结果(发现)最终印象表示 CT、MRI 和 X 射线等成像技术的研究代码
经过彻底的预处理和去识别化后,最终训练集包含 4,354,321 份报告,另外留出 2,114 份报告用于测试。采用了严格的清理方法,例如删除不正确的记录,以降低出现“幻觉”(不正确的输出)的可能性。
技术亮点
该模型使用两种方法进行训练:
- 完全微调:调整所有模型参数。QLoRA:一种具有 4 位量化的低秩自适应方法,使计算更高效。