背景:在 DESIRE 研究中(使用人工智能预测术后出院),我们之前已经在 1,677 名胃肠道和肿瘤外科患者中开发并验证了一种机器学习概念,该概念可以预测术后第二天后的安全出院。尽管模型在学术外科人群中表现出色(受试者工作特征曲线下面积为 0.88),但这些发现是否可以推广到其他医院和外科人群仍不得而知。因此,我们旨在确定之前开发的机器学习概念的普遍性。方法:我们在 2017 年 1 月至 2021 年 6 月期间入住荷兰 3 家非学术医院的胃肠道和肿瘤外科患者中对机器学习概念进行了外部验证,这些患者在手术后 2 天内仍住院。主要结果是预测术后第二天医院干预的能力,这些干预被定义为计划外的再次手术、放射学干预和/或静脉注射抗生素。对四个森林模型进行了本地训练,并根据受试者工作特征曲线下面积、敏感性、特异性、阳性预测值和阴性预测值进行了评估。结果:所有模型都对 1,693 例病例进行了训练,其中 731 例(29.9%)需要医院干预,并表现出良好的性能(受试者工作特征曲线下面积仅变化 4%)。最佳模型实现了 0.83 的受试者工作特征曲线下面积(95% 置信区间 [0.81 e 0.85])、敏感度为 77.9%(0.67 e 0.87)、特异度为 79.2%(0.72 e 0.85)、阳性预测值为 61.6%(0.54 e 0.69),阴性预测值为 89.3%(0.85 e 0.93)。结论:这项研究表明,先前开发的机器学习概念可以通过对本地患者数据进行模型训练来预测不同外科人群和医院环境(学术与非学术)中的安全出院。鉴于其高准确性,将机器学习概念整合到临床工作流程中可以加快外科出院速度,并通过减少可避免的住院天数来帮助医院应对容量挑战。© 2022 作者。由 Elsevier Inc. 出版。这是一篇根据 CC BY 许可 ( http://creativecommons.org/licenses/by/4.0/ ) 开放获取的文章。