曲线下的药物 (AUC)

旨在了解您的代理解决方案是否实际上更好 曲线下代理 (AUC) 帖子首先出现在走向数据科学上。

来源:走向数据科学

TLDR

  • 在医疗保健领域通常会输出二元决策,例如疾病或无疾病,这些决策本身无法产生有意义的 AUC。
  • AUC 仍然是比较医学风险和检测模型的标准方法,它需要连续的评分,以便我们按风险对患者进行排名。
  • 这篇文章描述了将代理输出转换为连续分数的几种实用策略,以便基于 AUC 与传统模型的比较保持有效和公平。
  • 代理与曲线下区域断开

    代理人工智能系统变得越来越普遍,因为它们降低了人工智能解决方案的进入门槛。他们通过利用基础模型来实现这一目标,这样就不需要总是将资源花费在从头开始训练自定义模型或多轮微调上。

    我注意到 NeurIPS 2025 上大约 20-25% 的论文都集中在代理解决方案上。医疗应用代理也在同步崛起并受到欢迎。这些系统包括法学硕士驱动的管道、检索增强代理和多步骤决策框架。他们可以合成异构数据,逐步推理,并生成上下文建议或决策。

    大多数这些系统都是为了回答“这位患者是否患有这种疾病”或“我们是否应该进行这项测试”等问题而构建的,而不是“这位患者患有这种疾病的概率是多少”。换句话说,他们倾向于做出艰难的决定和解释,而不是经过校准的概率。

    相比之下,传统的医疗风险和检测模型通常使用受试者工作特征曲线下面积或 AUC 进行评估。 AUC 深深嵌入临床预测工作中,是许多成像、风险和筛查研究中比较模型的默认指标。

    为什么 AUC 很重要以及为什么二进制输出失败

    AUC 的计算方式

    为了充分理解差距并欣赏解决方案的尝试,我们应该回顾一下 AUC 的计算方式。

  • y∈ {0, 1} 为真实标签
  • “疾病”映射到 1