本研究旨在利用“肺癌预测”数据集,分析三种分类模型(决策树分类器、支持向量机和朴素贝叶斯分类器)在预测肺癌方面的表现。所采用的性能评估指标包括准确率、精确率加权、召回率加权和 F1 加权。作为初步步骤,进行了探索性数据分析 (EDA) 和数据集预处理,包括特征选择、数据清理和数据转换。测试数据结果显示,决策树分类器和朴素贝叶斯分类器具有相似的性能,准确率、精确率、召回率和 F1 值都很高。同时,支持向量机也表现出了竞争力,尽管其精确率加权值略低。此外,使用箱线图进行了异常值分析,结果显示决策树分类器有 2 个异常值,而支持向量机有 4 个异常值,朴素贝叶斯没有异常值。总而言之,这三种分类模型在肺癌预测中都表现出良好的潜力。然而,选择最佳模型需要考虑应用的相关评估指标,并考虑到每个模型的局限性。需要进一步评估和深入分析,以确保模型在更准确和一致地预测肺癌病例方面的可靠性。
摘要 如果青光眼这种眼部疾病未被发现且未得到适当治疗,则会导致不可逆的失明。最大的挑战是青光眼在早期往往没有任何症状,因此很难使用眼压测量和眼科检查等传统测试方法进行检测。由于训练数据集不足,几种青光眼检测技术遇到了困难,导致过度拟合和欠拟合问题。提出了一种基于 CNN-SVM 的混合机器学习方法来检测青光眼。首先使用标准标量对从青光眼数据集中获取的图像进行预处理,然后将预处理后的图像输入 CNN 以转换为高级特征,随后将提取的特征传递到 SVM 分类器以区分正常情况和青光眼情况。实验结果表明,所提出的 CNN-SVM 的准确率、精确率、召回率和 F1 分数均为 100%,证明了其优于其他现有技术,例如 SVM 的准确率、精确率、召回率和 F1 分数分别为 93%、92%、90% 和 94%,CNN 的准确率、精确率、召回率和 F1 分数分别为 95%、99%、88% 和 90%。CNN 和 SVM 的结合为自动青光眼检测提供了一个有前途的框架,为现实世界的临床应用提供了巨大潜力。 关键词:混合机器学习技术、青光眼检测、CNN、SVM、CNN-SVM 简介 人体共有五种感官:触觉、视觉、听觉、嗅觉和味觉;然而,视觉是最常用的感官之一。处理视觉信息需要大量的脑力(广州等人,2019 年)。青光眼、糖尿病视网膜病变、白内障、弱视、屈光不正和老年性黄斑变性是一些可能导致
自闭症谱系障碍 (ASD) 的特征是社交和认知技能受损、情绪障碍、焦虑和抑郁。传统的 ASD 诊断过程冗长,迫切需要早期进行有意义的干预。最近,不同的研究提出了通过使用深度神经网络 (DNN) 和机器学习算法进行情绪预测来进行 ASD 诊断和干预的潜力。然而,这些系统缺乏通过多个基准数据集进行广泛的大规模特征提取 (LSFE) 分析。需要进行 LSFE 分析来识别和利用最相关的特征和通道进行情绪识别和 ASD 预测。考虑到这些挑战,我们首次分析和评估了一个广泛的特征集,以使用 LSFE 和特征选择算法 (FSA) 选择最佳特征。使用不同的最佳情况 FSA 确定了一组最多八个最合适的通道。还确定了通道和特征的主体重要性。所提出的方法使用线性支持向量机 (LSVM) 分类器进行情绪预测时,最佳准确率、精确率和召回率分别为 95%、92% 和 90%。它还为 ASD 分类提供了 100% 的最佳准确率、精确率和召回率。这项工作利用了文献中迄今为止报告的最大数量的基准数据集 (5) 和主题 (99) 进行验证。本文提出和使用的 LSVM 分类算法的复杂度明显低于最近 ASD 和情绪预测系统中使用的 DNN、卷积神经网络 (CNN)、朴素贝叶斯和动态图 CNN。
机器学习模型中用于健康保险中欺诈检测的预测准确性是保护财务损失和维持保险系统完整性的关键边界。在美国和英国等发达经济体中,由于复杂的机器学习算法和数据分析的整合,欺诈检测的预测准确性取得了重大进步。例如,Johnson(2018)的一项研究分析了美国的欺诈检测系统,发现近年来精确率从80%提高到95%以上。 这种改进意味着这些系统可以增强的能力准确识别欺诈活动,同时最大程度地减少误报。 同样,在英国,金融行为管理局(FCA)的报告表明,召回率从70%增加到85%,展示了该系统捕获更高比例实际欺诈案件的能力。 这些趋势强调了金融机构和监管机构的持续努力和投资,以增强发达经济体的欺诈检测机制。例如,Johnson(2018)的一项研究分析了美国的欺诈检测系统,发现近年来精确率从80%提高到95%以上。这种改进意味着这些系统可以增强的能力准确识别欺诈活动,同时最大程度地减少误报。同样,在英国,金融行为管理局(FCA)的报告表明,召回率从70%增加到85%,展示了该系统捕获更高比例实际欺诈案件的能力。这些趋势强调了金融机构和监管机构的持续努力和投资,以增强发达经济体的欺诈检测机制。
摘要 - 情绪分析在理解公众情绪方面起着至关重要的作用,尤其是在数字通信领域,因为每天都会产生大量的文本数据。本研究深入探讨了情绪分类模型,即朴素贝叶斯分类器 (NBC) 和支持向量机 (SVM),在情绪分析任务中经常遇到的不平衡数据集中的有效性。采用比较分析方法,以来自在线平台的机器人酒店评论数据集作为评估的基础。NBC 和 SVM 模型都经过训练和评估,使用和不使用合成少数过采样技术 (SMOTE),以纠正类别不平衡。性能评估依赖于关键指标,包括准确度、召回率、精确度、f 测量和曲线下面积 (AUC) 来衡量模型的有效性。研究结果表明,SVM 在准确率(SVM:76.88%,NBC:67.43%)、精确率(SVM:92.03%,NBC:86.87%)、召回率(SVM:58.88%,NBC:41.00%)、f 值(SVM:71.78%,NBC:55.63%)和 AUC(SVM:0.907,NBC:0.961)方面均优于 NBC。引入 SMOTE 后,两种模型的性能均显著提升,尤其是在解决类别不平衡问题方面。虽然 NBC 在精确率和召回率指标上表现更为均衡,但 SVM 在情感分类任务中展现出更高的准确率和预测能力。这些发现强调了算法选择和预处理技术在优化情感分析性能方面的关键作用,从而为从业者和研究人员提供了宝贵的见解。
检测脑癌的医学图像处理方法仍然主要是手动完成,准确度低且时间长。此外,这项任务只有拥有高水平医疗能力的专业人员才能完成,而与需要救治的大量患者相比,专家的数量显然是有限的。随着人工智能的增长以及计算机在处理速度和存储容量方面的飞速发展,可以协助医生对头部肿瘤的存在进行分类。本研究使用了 EfficientNet 架构的四种变体,旨在针对各种 MRI 成像数据训练模型。 B1版本模型被证明是本次调查中最好的,从B0到B3版本(4个版本),准确率高达98%,精确率高达99%,召回率高达95%,f1分数高达97%。这些结果非常好,但并不排除使用不同设计形式进行进一步的研究。
脑肿瘤是最常见的、最严重的癌症类型,大多数晚期患者的预期寿命只有几个月。因此,制定最佳治疗方案对于提高患者的抗癌能力和生活质量至关重要。各种成像方式,如计算机断层扫描 (CT)、磁共振成像 (MRI) 和超声成像,通常用于评估脑肿瘤。这项研究提出了一种提取和分类 3D 脑切片图像中肿瘤特征的新技术。对输入图像进行去噪、调整大小和平滑处理后,使用感兴趣体积 (VOI) 提取脑肿瘤的特征。然后使用基于表面、曲线和几何图案的可变形分层启发式模型-深度反卷积残差网络 (DHHM-DDRN) 对提取的特征进行分类。实验结果表明,所提出的方法对脑癌特征的分类准确率为 95%,DSC 为 83%,精确率为 80%,召回率为 85%,F1 得分为 55%。
网络入侵检测系统 (NIDS) 是现代网络安全框架的重要组成部分,旨在检测和缓解网络内的恶意活动。本研究探索了人工智能 (AI) 技术(包括机器学习 (ML) 和 DL)的应用,通过准确的入侵检测来提高网络安全。使用 CIS-CICIDS2017 数据集,采用了全面的预处理流程,包括数据清理、基于 SMOTE 的平衡、最小-最大规范化和特征选择。随机森林 (RF) 模型表现出优异的性能,准确率为 99.90%,精确率为 97.78%,召回率为 97.08%,F1 得分为 97.41%。与决策树 (DT)、堆叠 LSTM 和 AdaBoost 模型的比较分析突出了 RF 在检测和分类网络流量方面的稳健性。未来的研究旨在优化特征工程并探索混合 AI 模型,以改进动态网络环境中的实时入侵检测。
大多数日常活动需要灵巧地使用手和手指。残疾人的手部假肢可以通过连接到上肢的表面电极非侵入式获取的表面肌电图 (sEMG) 信号来控制。在对从 10 位截肢者获取的 12 个电极 sEMG 信号进行预处理后,计算了时域和频域中的不同特征。考虑到 sEMG 是一种复杂、随机、非平稳和非线性信号,还通过多重分形去趋势波动分析 (MFDFA) 的方法提取了复杂的非线性特征。使用不同的分类方法(包括支持向量机 (SVM)、线性判别分析 (LDA) 和多层感知器 (MLP))来比较它们在八种不同手指运动分类中的表现。观察发现,SVM 在手指运动分类方面的表现优于其他两个分类器。新特征与传统特征融合后,分类准确率、精确率、召回率(灵敏度)分别为98.70%、98.74%、98.67%。结果表明,加入MFDFA提取的新特征与其他传统特征,可以有效提高数据采集效果。
摘要 —脑出血的特征是由于血液凝结或高血压导致脑动脉破裂,存在严重的创伤甚至死亡风险。这种出血会导致脑细胞损伤,常见原因包括脑肿瘤、动脉瘤、血管异常、淀粉样血管病、创伤、高血压和出血性疾病。当发生出血时,氧气无法再到达脑组织,如果脑细胞缺氧和营养物质超过三四分钟,就会开始死亡。受影响的神经细胞及其控制的相关功能也会受到损害。早期发现脑出血至关重要。本文提出了一种有效的混合深度学习 (DL) 模型,用于从脑 CT 图像中检测颅内出血 (ICH)。所提出的方法集成了 DenseNet 121 和长短期记忆 (LSTM) 模型,以准确分类 ICH。DenseNet 121 模型用作特征提取模型。实验结果表明,该模型的准确率、精确率、召回率和 F1 分数分别为 97.50%、97.00%、95.99% 和 96.33%,证明了其在准确识别和分类 ICH 方面的有效性。