言语障碍 (SD) 的分类对于治疗患有言语障碍 (SI) 的儿童至关重要。自动 SD 分类可以帮助言语治疗师为农村地区的 SI 儿童提供服务。检测 SD 的自动化技术可以客观评估语音属性,包括发音、流利度和韵律。临床检查和定量评估可以深入了解患者的说话能力和局限性。现有的用于 SD 检测的深度学习 (DL) 模型通常缺乏对不同人群和语音变化的泛化,导致在应用于具有不同语言背景或方言的个体时性能不佳。本研究介绍了一种基于 DL 的模型,用于使用语音样本对正常和异常语音进行分类。为了克服过度拟合和偏差,作者构建了具有 MobileNet V3 和 EfficientNet B7 模型权重的卷积神经网络模型,用于特征提取 (FE)。为了提高性能,他们将挤压和激励块与基于 MobileNet V3 的 FE 模型集成在一起。同样,使用结构修剪技术改进了基于 EfficientNet B7-mod el 的 FE。增强型 CatBoost 模型使用提取的特征区分正常和异常语音。实验分析使用包含 4620 个健康儿童话语和 2178 个 SI 儿童话语的公共数据集进行。比较研究揭示了所提出的 SD 分类模型的卓越性能。该模型的表现优于当前的 SD 分类模型。它可以用于临床环境以支持语言治疗师。使用多样化语音样本进行大量训练可以提高所提模型的通用性。
解决分类和预测挑战,树木集成模型已获得了重要的重要性。促进集合技术是用于预测II型糖尿病的综合技术。光梯度提升机(LightGBM)是一种以其叶片生长策略,减少损失和增强的训练精度而闻名的算法。但是,LightGBM容易过度拟合。相比之下,Catboost使用了称为决策表的平衡基础预测值,该预测值可以减轻过度适应风险,并明显提高测试时间效率。catboost的算法结构抵消了梯度增强偏见,并结合了过度拟合的检测器以尽早停止训练。本研究的重点是开发一种混合模型,该模型结合了LightGBM和Catboost,以最大程度地减少过度拟合并通过降低方差改善效果。为了找到与基础学习者一起使用的最佳超级仪表,使用了贝叶斯超级参数操作方法。通过微调正则化参数阀,混合模型有效地降低了方差(过拟合)。针对LightGBM,Catboost,Xgboost,Deciest Crey,Random Forest,Adaboost和GBM算法的比较评估表明,混合模型具有最佳的F1得分(99.37%),召回率(99.25%)和准确性(99.37%)。因此,拟议中的框架对医疗保健行业的早期糖尿病有望有望,并显示出与糖尿病共享相似性的其他数据集的潜在适用性。
摘要:本研究使用各种机器学习分类模型,包括随机森林,逻辑回归,catboost,支持向量分类(SVC)和幼稚的贝叶斯进行基于技能的课程的学习分析。目标是将学生成果分为四个类:通过,区分,撤回和失败。这项研究有助于学习分析和教育中的机器学习应用的知识越来越多。这项调查的发现为教育者和学术机构提供了一个强大的框架,可早日识别出表现不佳或退出风险的学生,从而及时进行干预,以增强学生在基于技能的课程中的成功。关键字:随机森林,逻辑回归,catboost,支持向量分类(SVC)和幼稚的贝叶斯,MLP,LDA,被动侵略性分类器。简介学术界基于技能的课程的重要性日益重要,这是需要创新的方法来有效地监视和增强学生的绩效。本文旨在开发和比较各种ML分类模型,包括随机森林,逻辑回归,Catboost,SVC和幼稚的贝叶斯,以预测基于技能的课程的学生成果。通过分析历史学生数据,该项目试图将结果归类为通过,杰出,撤回和失败,并为高危学生提供有价值的见解,以供早期识别和干预。文献调查:-1。Jermine G.valen-dacanay。和Thelma D. Palaoag [2023]: - 预测学生的成功对于
印度尼西亚是世界上糖尿病患者最多的国家之一。糖尿病会引起严重的并发症,对患者来说具有潜在危险。本研究旨在通过考虑糖尿病的各种风险,使用分类增强 (CatBoost) 算法开发一个准确的预测模型来对糖尿病进行分类。 CatBoost 因其良好处理分类数据的能力而闻名。这项研究的初始阶段是数据处理或预处理,包括数据清理以处理不干净数据的问题、处理具有极端值的数据以及纠正不适当的数据类型。接下来,使用 CatBoost 算法进行创建预测模型的阶段,这是一种有效的决策梯度增强方法。使用混淆矩阵进行模型评估以评估分类性能。研究结果显示,糖尿病分类的准确率相当高,根据数据中使用的属性,准确率为 98.63%。希望这项研究能够有助于增进人们对糖尿病风险及其导致的死亡率的了解和控制。关键词:算法,CatBoost,糖尿病,分类,预测 1.介绍 糖尿病(DM)是一种由遗传因素、环境、饮食和其他因素引起的自身免疫性疾病[1]。糖尿病是一种与胰腺健康相关的疾病,胰腺产生胰岛素激素的异常会导致血糖水平升高。人体内血糖水平升高会扰乱肾脏、心脏和大脑等重要器官的功能 [2]。 2019 年,世界卫生组织 (WHO) 指出,至少有 200 万人的死亡可归因于糖尿病 [3]。根据2018年印尼卫生部在抗击糖尿病世界大会上的官方报告,印尼是世界上糖尿病患者最多的国家,位列第六。数据显示,印度尼西亚 20-79 岁年龄段的糖尿病患者数量达到约 1030 万人 [4]。
摘要。公平分配专业的医生是一个重大的公共卫生挑战。以前的研究主要依靠经典的统计模型来估计影响医学生职业选择的因素,但本研究探讨了机器学习技术在研究早期预测决策的使用。我们使用来自瑞士和法国医学院的399名医学院的399名医学生的数据评估了各种监督模型,包括支持向量机,人工神经网络,极端梯度提升(XGBOOST)和CATBOOST。集合方法的表现优于更简单的模型,而Catboost的宏观AUROC为76%。事后解释性方法揭示了影响预测的关键因素,例如成为外科医生的动机和外向性的心理特征。这些发现表明,机器学习可用于预测医疗职业道路并为更好的劳动力计划提供信息。
我们开发了一个机器学习(ML)框架,以预测接受MV的ICU患者的医院死亡率。使用MIMIC-III数据库,我们通过ICD-9代码确定了25,202名合格患者。我们采用了向后消除和套索方法,根据临床见解和文献选择了32个功能。数据预处理包括消除超过90%丢失数据的列,并为其余缺失值使用平均插补。为解决阶级失衡,我们使用了合成的少数群体过度采样技术(SMOTE)。我们使用70/30火车 - 策略分开评估了几种ML模型,包括Catboost,XGBOOST,DECOMAL TROED,随机森林,支持向量机(SVM),K-Nearest邻居(KNN)和Logistic回归。在准确性,精度,召回,F1得分,AUROC指标和校准图方面,选择了Catboost模型的出色性能。
摘要本文致力于评估电影推荐系统中集合机器学习模型的有效性。它探讨了各种集合方法,包括随机森林,adaboost,XGBoost,LightGBM,Catboost和梯度提升机,以增强预测用户偏好的准确性。该研究基于Movielens 100K数据集,该数据集包含1,682部电影中943位用户的100,000个评级。功能工程,数据归一化方法和迭代功能选择的应用提高了模型准确预测用户兴趣的能力。分析表明,XGBoost模型的最佳结果为0.902,与所考虑的其他模型相比,预测准确性更高。LightGBM和Catboost还显示了竞争结果,RMSE值分别为0.910和0.919。这项研究强调了综合方法在开发适应用户各种偏好和环境的建议系统中的重要性,并在该领域开辟了广泛的观点,以进一步研究。
背景:化生乳腺癌(MBC)是乳腺癌的罕见且高度侵略性的组织学亚型。仍然存在可用于临床实践的精确预测模型。方法:本研究利用SEER数据库(2010 - 2018)的患者数据进行数据分析。我们利用预后因素来开发一种新型的机器学习模型(CATBOOST)来预测患者的存活率。同时,我们医院的MBC患者队列被用来验证我们的模型。我们比较了三组患者的放射治疗的好处。结果:我们开发的Catboost模型表现出很高的准确性和正确性,使其成为预测MBC患者(1年AUC = 0.833,3年AUC = 0.806; 5年AUC = 0.810)的最佳表现模型。此外,Catboost模型在外部独立数据集中保持强劲的性能,1年生存率的AUC值为0.937,3年生存率为0.907,5年生存率分别为0.890。放射治疗更适合于接受M0阶段接受乳房持胸腔手术的患者[组:(OS:HR = 0.499,95%CI 0.320 - 0.777 P <0.001; BCSS:HR = 0.519,95%CI 0.290 - 0.290 - 0.929 P = 0.008)和那些在TT3-3-3-3-3-3-M中(OS:HR = 0.595,95%CI 0.437 - 0.810 P <0.001; BCSS:HR = 0.607,95%CI 0.427 - 0.862 P = 0.003)],与经过T1-2/N0-1M0的患者相比,接受了Mastrosy t1-n0-1m0阶段, 0.730; BCSS:HR = 1.909,95%CI 1.036 - 3.515 P = 0.038)。结论:我们开发了三个机器学习预后模型,以预测MBC患者的存活率。放射疗法被认为更适合接受M0阶段进行乳腺癌手术以及在T3-4/N2-3M0阶段进行乳房切除术的患者。
目标。我们探索机器学习技术,以预测星系之间的星形量,恒星质量和金属性,红移范围为0.01至0.3。方法。利用CATBOOST和深度学习体系结构,我们利用了来自SDSS的多播放和红外光度数据,并在SDSS MPA-JHU DR8目录上进行了跨训练。结果。我们的研究证明了机器学习的潜力,即仅从光度数据中准确预测星系特性。我们通过使用CATBOOST模型专门实现了最小化的根平方错误。对于恒星形成率的基础,我们达到了RMSE SFR = 0的值。336 dex,而对于恒星质量预测,将误差降低为RMSE SM = 0。206 dex。此外,我们的模型得出RMSE金属性= 0的金属性预测。097 DEX。 结论。 这些发现强调了自动化方法在有效估计多波长天文学数据的指数增长的情况下有效估计关键星系的重要性。 未来的研究可能会集中于精炼机器学习模型和扩展数据集,以实现更准确的预测。097 DEX。结论。这些发现强调了自动化方法在有效估计多波长天文学数据的指数增长的情况下有效估计关键星系的重要性。未来的研究可能会集中于精炼机器学习模型和扩展数据集,以实现更准确的预测。