供体衍生的无细胞DNA(DD-CFDNA)已成为检测移植排斥反应的有前途的生物标志物。这项研究旨在评估将其应用于肾脏移植排斥的诊断准确性和临床价值。从PubMed,Embase,Cochrane Library和Web of Science数据库中审查了有关肾脏移植拒绝中DD-CFDNA诊断的相关文献。数据和研究特征由两名研究人员独立提取。分别分析了任何排斥(AR)和抗体介导的排斥反应(ABMR)的诊断精度数据。潜在的异质性。漏斗图用于阐明出版偏见的存在或不存在。九本出版物提供了有关诊断AR患者的DD-CFDNA准确性的数据。具有95%置信区间(CIS)的接收器操作特征(AUROC)曲线下的汇总敏感性,特异性和面积为0.59(95%CI,0.48 - 0.69),0.83(95%CI,0.76 - 0.88)和0.80(95%CI,0.80(95%CI,0.76 - 0.76 - 0.83)。此外,12项研究集中在ABMR的DD-CFDNA的诊断准确性上,显示了95%CI为0.81(95%CI,0.72 - 0.88),0.80(95%CI,0.73 - 0.73 - 0.86)和0.87(95%)和0.87(95%)(95%CI,0.87(95%),95%CI(95%CI,0.72 - 0.88)和0.87(95%CI,0.84%),0.84(95%CI),表明汇总的灵敏度,特异性和AUROC曲线。研究类型,年龄组和样本量导致异质性。总而言之,我们的发现表明,虽然血浆DD-CFDNA诊断AR患者的准确性受到明显的异质性的限制,但它是诊断ABMR的有价值的生物标志物。
背景:大型语言模型(LLMS)占据了公共利益,因为它们的明显能力可以准确地复制叙事文本中的学习知识。但是,缺乏对医疗保健检查中LLM的准确性和能力标准的明确性。目的:与已知的人类绩效标准相比,我们对LLM准确性进行了系统的综述,该综述在医疗保健检查条件下进行了测试。方法:我们量化了LLM在回答医疗保健检查问题方面的准确性,并评估了研究报告的一致性和质量。搜索包括所有论文,直到2023年9月10日,所有LLM在英语期刊上发布了清晰的LLM准确性标准。The exclusion criteria were as follows: the assessment was not a health care exam, there was no LLM, there was no evaluation of comparable success accuracy, and the literature was not original research.The literature search included the following Medical Subject Headings (MeSH) terms used in all possible combinations: “artificial intelligence,” “ChatGPT,” “GPT,” “LLM,” “large language model,” “machine learning,” “neural network,” “生成预训练的变压器”,“生成变压器”,“生成语言模型”,“生成模型”,“体检”,“医疗保健检查”和“临床检查”。提取了敏感性,准确性和精度数据,包括相关的CI。结果:搜索确定了1673个相关引用。删除了重复的结果后,筛选了1268(75.8%)的论文,以获取标题和摘要,其中包括32(2.5%)的研究以进行全文审查。我们的荟萃分析表明,LLM能够以0.61(CI 0.58-0.64)和美国医疗许可检查(USMLE)0.51(CI 0.46-0.56)的整体医学检查准确性(CI 0.58-0.64)(CI 0.46-0.56)执行,而聊天生成的预期验证的变压器(CHATGPT)可以使用整体医学检查,而整体医学检查的准确性为0.6.6-6.6-6-6-6-6-6-6-6-6-64。结论:LLMS通过向关键决策者提供准确有效的特定于上下文特定信息,提供有望解决医疗保健需求和人员配备挑战的承诺。针对LLM的政策和部署决策,我们提出了一个名为Rubricc(监管,可用性,偏见,可靠性[证据和安全],互操作性,成本以及代码和医生 - 患者以及公众参与和公众参与和参与[PPIE])的新框架。这是一个宝贵的机会,可以将新的LLM功能临床调试用于卫生服务,同时尊重患者的安全考虑。试用注册:OSF注册osf.io/xqzkw; https://osf.io/xqzkw