摘要。垃圾邮件仍然是一个持久的问题,不仅消耗了时间和带宽,而且构成了重大的网络安全威胁。结果,有效的垃圾邮件过滤已成为必不可少的。重点是天真的贝叶斯(NB),决策树(DT)和支持向量机(SVM),本研究对当代垃圾邮件过滤中使用的主要机器学习技术进行了详尽的分析。本文研究了这些方法的基本原理,通过在Kaggle数据集上进行的广泛实验进行比较它们的性能,并讨论了垃圾邮件过滤技术的当前挑战和未来方向。研究表明,SVM对于处理高维数据特别有效,DT提供了卓越的解释性,而NB简化了概率分类。实验结果表明,尽管每种方法都具有其优势和劣势,但将SVM与NB结合起来显着提高了分类精度。尽管有这些进展,但由于不断发展的垃圾邮件策略,垃圾邮件过滤器仍然面临挑战。为了解决这些持续的问题,结论部分突出了需要更可靠,灵活的垃圾邮件过滤技术,并为将来的研究方向提出建议。
大脑中风是普遍死亡的第二大大量原因,在过去几年中一直是公共卫生的主要关注。借助机器学习技术,可以访问各种冲程警报的早期检测,这可以有效防止或减少中风。医学数据集在其类标签上经常不平衡,倾向于预测少数群体的趋势。在本文中,研究了中风的潜在危险因素。此外,还采用了四种独特的方法来改善中风数据集中少数群体的分类,这是合成重量投票分类器,合成的少数群体过度采样技术(SMOTE),主要组成部分分析,具有K-Means聚类(PCA-KMEANS)的主要成分分析(PCA-KMEANS),局灶性损失,与深度神经网络(COMPAL SERVANCY)(COMPAR)(DNN)(DNN)(DNN)(DNN)(DNN)(DNN)(DNN)。通过分析结果,具有DNN-局灶性损失的Smote和PCA-KMEANS最适合有限的大型严重不平衡数据集(例如,中风数据集),这是2-4倍以优于Kaggle的工作。关键字:不平衡数据集,中风预测,集合权重投票分类器,Smote,dnn的焦点损失,PCA-KMEANS
多囊卵巢综合征(PCOS)是一种常见的内分泌疾病,可破坏生殖功能和荷尔蒙平衡。它主要影响生殖时代的妇女,并导致影响生活质量的身体,代谢和情感挑战。在这项研究中,我们开发了一个基于机器学习的模型,以准确地从正常的骨盆超声图像中识别PCOS骨盆超声图像。通过利用Kaggle在线平台(Google LLC,Mountain View,CA)的1,932个骨盆超声图像,我们能够创建一个模型,该模型可以准确地检测到卵巢中的多个小卵泡,并从普通孔隙超声图中的PCOS Pelvic超声图像增加了卵巢量的增加。我们开发的模型表现出了有希望的性能,精确值为82.6%,召回值为100%,包括敏感性和特异性100%。总体准确度的值证明为100%,F1得分计算为0.905。由于我们研究获得的结果是有希望的,因此需要进一步的验证研究来推广模型的能力并纳入PCOS的其他诊断因素,例如体格检查和实验室值。
这项研究研究了机器学习(ML)算法与制造业,能源和医疗保健领域的智能传感器技术的整合,专注于它们对实时工业监测,预测性维护和运营效率的影响。通过利用来自UCI机器学习存储库和Kaggle的数据,该研究衡量了启用ML的传感器在减少机器停机时间和增强故障检测方面的有效性。时间序列分析和回归建模表明,传感器的集成导致机器正常运行时间的显着提高5.5%,将平均正常运行时间从91.5%提高到97%,从而验证了预测性维护的作用。成本效益分析进一步强调,能源部门获得了最高的财务回报,在五年内,ROI 33.3%和正净现值(NPV),相对于初始投资,可节省大量成本。发现强调了传感器基础架构兼容性的重要性,强调了对诸如Edge Computing和Digital Twin Technology等适应性框架的必要性,以确保与Legacy Systems有效整合。建议包括整个行业的采用策略,这些策略利用这些技术来优化预测性维护并最大程度地提高部门特定的财务回报。
muhtarom ahkam maulana脑肿瘤是脑细胞在脑组织中生长和发育时的疾病。可以通过身体检查和手动诊断来对医生检测脑肿瘤。手动诊断有局限性,即误诊的可能性。对计算机视觉的发展已应用于脑肿瘤图像的分类。这项研究使用深度学习对脑肿瘤图像进行了分类,正是基于卷积神经网络(CNN)的转移学习方法。用于传输学习的预训练模型为Densenet121,InceptionResnetv2,MobilenetV2,NasnetMobile和Resnet50v2。数据集包含7020个图像,其中包含四个类别:神经胶质瘤,脑膜瘤,垂体和从Kaggle获得的无肿瘤。使用预训练模型的几种情况进行了测试,该模型用于超参数辍学率和已经调整的密集单元。使用平均精度,平均精度,平均灵敏度和平均特异性构建的模型评估。评估结果表明,表现最佳的模型的准确性为97.70%,损失为0.066。这些结果在混乱矩阵中说明了,该矩阵表明该模型可以很好地对脑肿瘤图像进行分类。关键字:分类,转移学习,脑肿瘤,卷积神经网络。
准确的时间估计对于确保不断增长的粮食交付行业的客户满意度和运营效率至关重要。本文着重于全面分析影响食品输送时间的因素,并评估机器学习模型在预测交付时间中的有效性。为此,作者在Kaggle平台上合并了一家食品送货公司的详细数据集,包括送货地址,订单时间,送货时间,天气条件,交通强度和交付人员的个人资料信息。该研究使用MAE,RMSE和R²等指标评估了各种机器学习模型,例如线性回归,决策树,随机森林,XGBRegressor(XGBRegressor(XGBRegressor)(XGBRegressor)(KNN)回归模型。结果表明,集合方法(XGBRegressor)在准确预测输送时间的情况下以其他模型的形式实现了其他模型,而R平方分数为0.82。此外,对特征重要性的彻底分析发现了影响交付时间估计的因素。本研究提供了有关利用机器学习技术的见解,以优化食品交付操作并提高客户满意度。这些发现可以帮助食品交付平台部署有效的时间估计模型并强调预测因素。
摘要:互联网的功能正在从计算机互联网 (IoC) 不断转变为“物联网 (IoT)”。大多数连接系统称为网络物理系统 (CPS),是由人类和物理环境、智能对象以及嵌入式设备和基础设施等众多特征的集成形成的。有一些关键问题,例如安全风险和道德问题,可能会影响物联网和 CPS。当每条数据和设备都连接到网络上并可获取时,黑客就可以获取它并将其用于不同的诈骗。在医疗保健 IoT-CPS 中,可以通过可穿戴传感器收集患者的日常医疗和身体数据。本文提出了一种支持 AI 的 IoT-CPS,医生可以利用它基于 AI 发现患者的疾病。人工智能的创建是为了发现一些疾病,例如糖尿病、心脏病和步态障碍。每种疾病在患者或老年人中都有不同的症状。从 Kaggle 存储库检索数据集以执行支持 AI 的 IoT-CPS 技术。对于分类,采用支持人工智能的 IoT-CPS 算法来发现疾病。实验结果表明,与现有算法相比,所提出的支持人工智能的 IoT-CPS 算法在准确率、精确度、召回率和 F 值方面更有效地检测患者疾病和老年人跌倒事件。
摘要 - 本文介绍了一项有关使用深度学习技术的手写签名验证的全面研究。本研究旨在应对离线签名验证的挑战,在此任务是自动区分真正的签名与伪造的挑战。所提出的方法利用了最新的深度学习模型,包括Mobilenet,Resnet50,InceptionV3和VGG19与Yolov5结合使用,以实现高精度分类和可靠的伪造检测。在多个基准数据集上评估了该系统,包括Kaggle签名,Cedar,ICDAR和SIGCOMP,在各种现实世界中展示了其有效性和鲁棒性。所提出的方法包括数据预处理技术,以增强输入手写签名图像的质量,从而使模型能够捕获基本功能和模式以进行准确的分类。结果表明,与现有的最新方法相比,提出的方法的优越性在识别真正的特征并准确检测伪造方面达到了出色的准确率(89.8%)。此外,该模型对变化数据集大小和配置的适应性进一步支持其在签名验证任务中实际部署的潜力。这项研究有助于脱机签名验证技术的发展,为确保各种应用程序中手写签名的安全性和真实性提供了可靠,有效的解决方案。
摘要 - 心血管疾病(CVD)对全球公共卫生构成了重大威胁,影响了各个年龄段的个人。胆固醇水平,吸烟,饮酒和身体不活跃等因素有助于其发作和进展。增强我们对CVD病因的理解并告知针对性的预防疾病和管理干预措施仍然是一个至关重要的挑战。在这项研究中,我们解决了使用机器学习技术来预测个人开发CVD的可能性的任务。具体来说,我们探讨了三种方法:k-neartheard邻居(KNN)算法,逻辑回归和随机森林算法。利用来自Kaggle的综合数据集,包括11个相关因素,我们进行了一系列实验,以确定CVD的最具影响力的预测指标。我们的分析不仅旨在预测疾病的发生,还旨在阐明有助于其表现的主要决定因素。通过对三种方法的比较分析,我们证明了随机森林算法在预测准确性方面表现出较高的性能。这项研究代表了利用机器学习技术的重要一步,以增强我们对CVD动态的理解,并为疾病预防和管理的有针对性的干预提供信息。
心脏病是全球主要的健康问题,导致全球发病率和死亡率居高不下。降低心脏病发病率最重要的方面之一是早期识别和预测。机器学习技术与可解释人工智能 (XAI) 相结合,为精准理解和预测心脏病风险变量提供了一条可行的途径。本文探讨了机器学习 (ML) 和可解释人工智能 (XAI) 在心脏病预测中的应用。该研究利用多种复杂算法,展示了基于机器学习的模型如何高效地识别心脏病高风险人群,并使用可解释人工智能 (XAI) 方法解释这些预测背后的原因。数据集来自 Kaggle,并使用预处理技术来准备用于训练机器学习模型的数据。这些模型包括决策树、随机森林、逻辑回归、支持向量机 (SVM)、KNN 和朴素贝叶斯。结果表明,随机森林表现最佳,逻辑回归表现接近。SHAP 应用于 LR 模型,这提供了直观的解释。此外,通过利用不同的形状图,他们提供了关于特定特征如何影响机器学习模型的预测的关键见解,增强了透明度并使模型更易于理解。