简介:基于人工智能的医疗设备 (AI-based MDs) 在医疗保健领域正呈指数级增长。本研究旨在调查当前评估 AI 的研究是否包含 HTA 机构进行健康技术评估 (HTA) 所需的信息。方法:我们根据系统评价和荟萃分析的首选报告项目方法进行了系统文献综述,以提取 2016 年至 2021 年期间发表的与基于 AI 的 MDs 评估相关的文章。数据提取侧重于研究特征、技术、算法、比较器和结果。计算 AI 质量评估和 HTA 分数以评估纳入研究中存在的项目是否符合 HTA 要求。我们对 HTA 和 AI 分数进行了线性回归,解释变量为影响因子、出版日期和医学专业。我们对 HTA 分数进行了单变量分析,对 AI 分数进行了多变量分析,alpha 风险为 5%。结果:在检索到的 5578 条记录中,包括 56 条。平均 AI 质量评估得分为 67%;32% 的文章的 AI 质量得分 ≥ 70%,50% 的文章得分在 50% 到 70% 之间,18% 的文章得分低于 50%。研究设计(82%)和优化(69%)类别的质量得分最高,而临床实践类别的得分最低(23%)。所有七个领域的平均 HTA 得分为 52%。100% 的研究评估了临床效果,而只有 9% 的研究评估了安全性,20% 的研究评估了经济问题。影响因子与 HTA 和 AI 得分之间存在统计学上的显著关系(均为 p = 0.046)。讨论:基于 AI 的 MD 的临床研究有局限性,而且往往缺乏适应性强、稳健和完整的证据。还需要高质量的数据集,因为只有输入可靠,输出数据才可信。现有的评估框架并非专门为评估基于人工智能的医疗器械而设计的。从监管机构的角度来看,我们建议应调整这些框架以评估持续更新的可解释性、可解释性、网络安全性和安全性。从 HTA 机构的角度来看,我们强调,实施这些设备需要透明度、专业和患者接受度、道德问题和组织变革。人工智能的经济评估应依靠稳健的方法(业务影响或健康经济模型),为决策者提供更可靠的证据。
主要关键词