摘要 简介 缺乏有效、一致、可重复和高效的哮喘确定方法,导致临床试验或其他研究的哮喘队列和研究结果不一致。我们旨在评估将基于专家人工智能 (AI) 的自然语言处理 (NLP) 算法应用于儿科人群的电子健康记录中的两种现有哮喘标准是否能够系统地识别具有独特特征的儿童哮喘及其亚群。方法 使用 1997-2007 年 Olmsted 县出生队列,我们将经过验证的 NLP 算法应用于预定哮喘标准 (NLP-PAC) 以及哮喘预测指数 (NLP-API)。我们将受试者分为四组(两项标准均为阳性 (NLP-PAC + / NLP-API + );仅 PAC 阳性 (仅 NLP-PAC +);仅 API 阳性 (仅 NLP-API +);和两项标准均为阴性 (NLP- PAC − /NLP-API − ))并对其进行了表征。使用实验室和肺功能测试 (PFT) 对哮喘患者和 300 名儿童的随机样本进行无监督聚类分析,结果得到了复制。结果 在 8196 名受试者(51% 为男性,80% 为白人)中,我们确定了 1614 名(20%)为 NLP-PAC + /NLP-API +;954 名(12%)为 NLP-PAC +;105 名(1%)为 NLP-API +;和 5523 名(67%)为 NLP-PAC − /NLP-API −。与其他组相比,被归类为 NLP-PAC + /NLP-API + 的哮喘儿童哮喘发作更早、Th2 特征更明显、肺功能更差、哮喘发作率更高、哮喘相关合并症风险更高。这些结果与基于无监督聚类分析以及随机样本研究对象的实验室和 PFT 数据的结果一致。结论 针对两种哮喘标准的专家 AI NLP 算法系统地识别了具有独特特征的儿童哮喘。这种方法可以提高哮喘大规模临床研究的精确度、可重复性、一致性和效率,并实现人群管理。
主要关键词