使用症状/体征检测呼吸系统疾病的人工智能 (AI) 系统可能会改善诊断,尤其是在资源有限的环境中。此类 AI 系统的异质性导致需要持续分析性能以指导未来的研究。本系统文献综述旨在研究使用机器学习 (ML) 根据症状和体征检测肺炎的诊断 AI 系统的性能和报告,并就设计和实施预测 ML 算法的最佳实践提供建议。本文遵循 PRISMA 协议进行,通过搜索 PubMed、Scopus 和 Ovid SP 数据库(上次搜索时间为 2021 年 5 月 5 日)确定了 876 篇文章。为了纳入,研究必须使用 AI 将临床诊断的肺炎与对照或其他疾病区分开来。使用 STARD 2015 工具评估偏倚风险。从 16 项纳入研究中提取了有关研究特征、ML 模型特征、参考测试、研究人群、准确度测量和伦理方面的信息。所有纳入的研究在研究设计、诊断设置、研究人群和 ML 算法方面都存在高度异质性。研究报告在方法和结果方面的质量很低。围绕 AI 算法的设计和实施的伦理问题没有得到很好的探索。虽然没有在所有研究中使用单一的性能指标,但大多数研究报告的准确度超过 90%。有强有力的证据支持进一步研究 ML,以便根据易于识别的症状和体征自动检测肺炎。为了帮助提高未来研究的有效性,根据本研究的结果提供了设计和实施 AI 工具的建议。
主要关键词