医疗自我诊断算法(或症状检查器)正日益成为数字健康和我们日常生活中不可或缺的一部分。在本文中,我们介绍了基于人工智能 (AI) 的症状检查器 Avey。同时,我们提出了一种全面的实验方法,利用标准临床插图方法来评估症状检查器。基于此方法,我们编制并同行评审了迄今为止该领域最大的基准插图套件。之后,我们定义了七个准确度指标,并利用这个插图套件从不同角度评估 Avey 和其他五种流行症状检查器的性能。此外,我们将 Avey 的准确度与三名平均经验为 16.6 年的经验丰富的初级保健医生进行了比较。结果显示,Avey 的表现明显优于五种症状检查器,并且比医生的表现更佳。