摘要。心脏病的发病率和死亡率正在增加,这对公共卫生和全球经济产生了负面影响。心脏病的早期发现降低了心脏死亡率和发病率的发生率。最近的研究利用量子计算方法来预测5个以上的心脏病,并且在计算中进行了密集。尽管量子数数量较高,但较早的工作报告说,预测心脏病的准确性较低,没有考虑到异常效应,并且需要更多的计算时间和记忆来预测心脏病。为了克服这些局限性,我们建议使用几个量子位(2至4个)(2至4)提出混合随机森林量子神经网络(HQRF),并考虑了数据集中异常值的影响。在本研究中使用了两个开源数据集Cleveland和Statlog应用量子网络。所提出的算法已应用于两个开源数据集,并利用了两种不同类型的测试策略,例如10倍的交叉验证和70-30列车/测试率。我们将我们提出的方法论的性能与较早的算法(称为杂交量子神经网络(HQNN))的算法进行了比较。HQNN和HQRF在10倍的交叉验证和70/30列车/测试拆分率中的表现均优胜。结果表明,HQNN需要大型培训数据集,而HQRF更适合大型和小型培训数据集。根据实验结果,与HQNN相比,提出的HQRF对异常数据不敏感。与较早的作品相比,拟议的HQRF在使用Cleveland和Statlog数据集的预测心脏病方面的曲线(AUC)下达到了96.43%和97.78%的最大面积,使用HQNN。所提出的HQRF在早期检测心脏病方面非常有效,并将加快临床诊断。
心脏病是一种常见疾病,可导致死亡,难以手动检测。更有效的分类模型依靠机器学习方法来实现更高的分类精度,吸引了研究人员的注意力设计有效的预测模型。此外,它在医学心脏病学的实际应用中起着重要作用,目的是早期发现心脏病。在本文中,根据提出的自适应特征选择技术,使用四种机器学习方法提出了有效而准确的心脏病检测系统:支持向量机(SVM),逻辑回归(LR),决策树(DT)和随机森林(RF)。使用两种特征选择方法来设计提出的技术,相互信息(MI)和递归功能消除(RFE),以确定提高分类模型性能并降低模型实现时间复杂性的最佳选定特征数量。所提出的技术是在UCI机器学习存储库的两个标准数据库上实施的:克利夫兰心脏病和心脏statlog cleveland。使用交叉验证方法选择并保存为预测模型。结果表明,每个数据都根据分类器模型选择了不同数量的功能。对于第一个心脏病数据集,与其他分类器模型相比,最佳心脏病检测系统支持矢量机器 - 毫无用量信息(SVM-MI)的最高分类精度约为96.755。虽然第二个数据集的随机森林 - 杂种信息(RF-MI)模型的准确度为97.4%。与该领域的最新研究相比,该技术在准确性,F1分数,准确性和度量检索方面产生了最高的预测性能。
全球,心血管疾病是死亡的主要原因。基于临床数据,机器学习(ML)系统可以在早期阶段检测心脏病,从而降低死亡率。然而,在ML中,不平衡和高维数据一直是持续的挑战,在许多现实世界中(例如检测心血管疾病的检测)阻碍了准确的预测数据分析。为了解决这个问题,已经开发了针对心脏病检测的计算方法。但是,他们的表现仍然不足。因此,本研究为心脏病模型(称为SPFHD)提供了一个新的堆栈预测因子。SPFHD使用五种基于树的基于树的集合学习算法作为心脏病检测的基本模型。此外,使用支持向量机算法的基础模型的预测进行了整合,以增强心脏病检测的准确性。开发了一种新的条件变异自动编码器(CVAE)方法来克服不平衡问题,该方法的性能比常规平衡方法更好。最后,SPFHD模型是通过贝叶斯优化调整的。结果表明,所提出的SPFHD模型的表现优于四个数据集的最新方法,分别为HD Clinical,Z-Alizadeh Sani,Statlog和Cleveland的HD Clinical,HD Clinical,HD Clinical,HD Clinical clinical of 4.68%,4.55%,2%和1%。此外,这个新框架提供了重要的解释,通过利用强大的Shapley添加说明(SHAP)算法来帮助理解模型成功。这重点介绍了检测心脏病的最重要属性,并克服了当前无法揭示特征之间因果关系的当前“黑盒”方法的局限性。
摘要 — 提高心脏病检测方法的精确度对于减少与诊断过程相关的昂贵医疗费用至关重要。从医疗数据中提取模式可以解开关联以改进心脏病诊断技术。本研究旨在构建一个高效的机器学习模型,作为医疗决策支持系统的可靠组成部分。研究了七种不同的机器学习模型,包括逻辑回归、支持向量分类器、K 最近邻 (KNN)、随机森林、决策树、朴素贝叶斯和梯度提升分类器,这些模型被全面探索用于心脏病分类。这些算法的超参数优化涉及三种技术:网格搜索、随机搜索和贝叶斯搜索。对每个模型性能的评估包括测量特异性、敏感性和 F1 分数,利用来自三个医疗诊所(克利夫兰、Statlog、匈牙利)的具有 12 个属性和 1189 个观测值的数据集。特征选择方法包括包装方法、嵌入方法卡方和方差分析,用于识别高度相关的特征,最终将数据的维度降低到 7 个特征。评估过程采用 10 倍交叉验证,表明随机森林模型实现了最高平均准确率 92.85%,超过了之前报告的 86.9%。此外,10 倍交叉验证确保了模型的可靠性和对数据不平衡的弹性。基于集成的方法再次证明了随机森林在诊断心脏病方面的卓越性能,准确率高达 94.96%。总之,这种开发的模型在心脏病分类中表现出可靠性,并为医疗应用提供了一种有前途的解决方案,可以有效地降低诊断成本和时间限制。关键词——应用机器学习、冠心病、随机森林