血清电泳(SPEP)是一种用于分析血液中最重要蛋白质的分布的方法。主要的临床问题是存在抗体(M蛋白/副蛋白)的单克隆分数,这对于诊断和下血液学疾病(例如多发性骨髓瘤)至关重要。最近的研究表明,可以通过例如检查蛋白质聚糖模式来跟踪肿瘤手术,可以使用机器学习来评估蛋白质电泳。在这项研究中,我们比较了26种不同的决策树算法,通过使用来自血清蛋白质毛细血管电泳的数值数据,以鉴定人血清中M蛋白的存在。对于数据的自动检测和聚类,我们使用了一个由67,073个样本组成的匿名数据集。我们发现了五种具有较高能力检测M蛋白质的方法:额外的树(ET),随机拟合(RF),直方机分级增强回收期(HGBR),轻梯度增强方法(LGBM)和极端梯度增强(XGB)。此外,我们实施了一种游戏方法来披露数据集中的哪些功能,这些功能表明了由此产生的M蛋白诊断。结果验证了伽马球蛋白的馏分和β球蛋白分数的一部分是电泳分析的最重要特征,从而增强了我们方法的可靠性。最后,我们测试了分类的M蛋白质同种型的算法,其中ET和XGB在测试的五种算法中表现出最佳性能。我们的结果表明,血清毛细管电泳与决策树算法相结合,在应用M蛋白的快速,准确鉴定方面具有巨大的潜力。此外,这些方法将适用于各种血液分析,例如血红蛋白病,表明诊断范围广泛。但是,对于M蛋白质同种型分类,将机器学习解决方案与毛细血管电泳的数值数据与凝胶电泳图像数据相结合是最有利的。
主要关键词