目的:开发一个可以预测新发育糖尿病(NOD)患者胰腺导管腺癌(PDAC)的风险的机器学习模型。方法:从50岁> 50岁的个体的基于人群的样本中,包括胰腺癌相关糖尿病(PCRD)的患者(定义为点头),然后在3年内进行了PDAC诊断(n = 716)。这些PCRD患者以1:1的比率随机匹配,其点点头。来自丹麦国家健康注册表的数据用于开发一个随机的森林模型,以将PCRD与2型糖尿病区分开。该模型基于从常规生化变量的轨迹上得出的特征工程的年龄,性别和参数。使用接收器操作特征曲线(ROC)和相对风险评分评估模型性能。结果:最歧视的模型包括20个功能,并达到了ROC-AUC为0.78(CI:0.75 - 0.83)。与一般性点头人群相比,该模型预测的1%的PCRD的相对风险增加了20倍(癌症风险最高(3年的癌症风险为12%,敏感性为20%)。年龄是最歧视性的单一特征,其次是血红蛋白A1C和最新的血浆甘油三酸酯水平的变化率。当预测模型仅限于糖尿病诊断六个月后诊断为PDAC患者时,ROC-AUC为0.74(CI:0.69 - 0.79)。结论:在基于人群的环境中,使用有关年龄,性别和常规生化变量的性别的信息的机器学习模型表现出PCRD和2型糖尿病之间的良好歧视能力。
主要关键词