使用深度学习(DL)的新机器学习方法(ML)超过时间系列模型,通常比传统的ML算法更准确。但是,这些相同的模型(DL)是其缺点,因为它花了大量时间来训练它们在其超偏见的复杂定制任务中。可以看出,使用包装技术(RF)和增强(GBM)的另一种强大的ML方法(即随机森林(随机森林-RF)和梯度增强机)的关注较少。它们的计算量较高,而不是时间串联模型,超出了超级保障者的自定义活动的复杂程度远不那么复杂。鉴于此发现,选择了其中两种 - 随机森林和LightGBM,因为它们代表了强大的方法,并且可以有效地捕获数据中的复杂非线性模式。从对这些技术的分析中,我们试图建立一种方法,以系统地获取一种能够协助分析师参与决策过程的工具,以了解投资,赚钱或等待和得出有关在巴西市场中潜在使用机器学习技术的结论,从而提出了推荐的推荐实践和/或/或/或/或/或/或/或/或/或/或/或/或/或/或/或/或/或/或/或/of。首先,进口的数据分区分为三组(培训,验证和测试),并且采用了两种数据分离方法:一种使用数据的时间方面和另一个随机除法。该过程遵循数据收集和存储步骤,价格序列的处理和归一化,串联属性的分析,从原始属性创建新属性,使用预测模型以及结果分析。值得注意的是,数据还使用描述为时间栏的方法的自定义标记。总而言之,考虑到所研究的问题,尽管随机分裂具有更有效的措施,这与使用时间分割有关。关于算法,LGBM证明了它的效果更好。
背景:及时准确的结果预测在指导急性缺血性卒中的临床决策中起着至关重要的作用。急性期后的早期病情恶化和严重程度是长期结果的决定因素。因此,预测早期结果在急性卒中管理中至关重要。然而,解释预测并将其转化为临床可解释的概念与预测本身一样重要。目的:这项工作专注于机器学习模型分析在预测缺血性卒中早期结果中的应用,并使用模型解释技巧来解释结果。方法:招募 2009 年在长庚医疗系统卒中登记处 (SRICHS) 登记的急性缺血性卒中患者,对两个主要结果进行机器学习预测:出院时的改良 Rankin 量表 (mRS) 和住院期间病情恶化。我们将 4 种机器学习模型,即支持向量机 (SVM)、随机森林 (RF)、轻梯度提升机 (LGBM) 和深度神经网络 (DNN) 与受试者工作特征曲线的曲线下面积 (AUC) 进行了比较。此外,3 种重采样方法,即随机欠采样(RUS)、随机过采样和合成少数过采样技术,处理了不平衡数据。模型基于特征重要性排序和 SHapley 加性解释(SHAP)进行解释。结果:RF 在两种结果中均表现良好(出院 mRS:平均 AUC 0.829,SD 0.018;院内恶化:原始数据上的平均 AUC 0.710,SD 0.023,对于不平衡数据,使用 RUS 重采样数据上的平均 AUC 0.728,SD 0.036)。此外,DNN 在预测未重采样数据的院内恶化方面优于其他模型(平均 AUC 0.732,SD 0.064)。总体而言,重采样对使用不平衡数据预测院内恶化的模型性能的改善有限。从美国国立卫生研究院卒中量表 (NIHSS) 获得的特征、白细胞分类计数和年龄是预测出院 mRS 的关键特征。相反,NIHSS 总分、初始血压、是否患有糖尿病以及血象特征是预测住院期间病情恶化的最重要特征。SHAP 摘要描述了特征值对每个结果预测的影响。结论:机器学习模型在预测早期卒中结果方面是可行的。丰富的特征库可以提高模型性能。初始神经系统水平和年龄决定了出院时的活动独立性。此外,