在医疗保健中,释放的少量数据集没有用于构建ML模型的通用数据输入格式。结果,当释放模型时,它们对数据集预处理和预期输出格式做出了不同的假设,从而导致了重大的可重复性挑战(McDermott等,2021; Wornow等,2023)。需要保证在医疗保健上升中的模型最低效果(Shah等人,2024年),并需要提高透明度的呼吁,我们需要启用NLP和CV社区中的模型共享和代码可重复使用。为了满足这一需求,我们介绍了医疗事件数据标准(MEDS,可在https://github.com/medical-event-data-andard/meds访问),这是机器学习的结构性电子健康记录(EHR)数据的数据输入标准,该数据具有三个关键好处:
主要关键词