抽象的一种影响全世界许多人的慢性疾病是糖尿病性疾病。如果在早期预测该疾病,则风险和严重程度都可以显着降低。In this research, we need to predict the type 2 diabetic patients at an early stage to reduce the cost of treatment for countries because this is a long time disease we use many machine learning algorithms to find the accuracy for these diseases applied to BRFSS datasets for two years 2014 and 2015 with a different selection of features to predict the disease as decision tree, logistic regression, ADA Boost Classifier, extreme gradient boosting, Linear Discriminant Analysis, Light梯度提升机和Catboost分类器。在使用2014 BRFSS数据集应用我们的实验时,神经网络具有最高的精度,而2015 BRFSS数据集则最佳准确度模型对于Catboost分类器和极端梯度提升,其中最低模型是线性判别分析。此外,在我们的研究中,我们使用具有不同功能选择并获得高精度的相同数据集进行了比较我们的结果。关键字:慢性疾病;糖尿病性麦芽膜;机器学习;人工智能;分类
摘要随着技术高级和电子商务服务的扩展,信用卡已成为最受欢迎的付款方式之一,导致银行交易量增加。此外,欺诈的显着增加需要高银行交易成本。因此,检测欺诈活动已成为一个引人入胜的话题。在这项研究中,我们考虑使用类重量超级参数来控制欺诈和合法交易的重量。我们特别使用贝叶斯优化来优化超参数,同时保留诸如不平衡数据之类的实际问题。,我们提出重量调整作为不平衡数据的预先过程,以及Catboost和XGBoost,以通过考虑投票机制来提高LightGBM方法的性能。最后,为了进一步提高绩效,我们使用深度学习来微调超参数,尤其是我们提出的重量调节器。我们对现实世界数据进行一些实验,以测试提出的方法。为了更好地覆盖不平衡的数据集,除了标准ROC-AUC外,我们还使用召回精度指标。使用5倍的交叉验证方法分别评估了Catboost,LightGBM和XGBoost。此外,大多数投票集合学习方法用于评估组合算法的性能。LightGBM和XGBoost达到了ROC-AUC D 0.95,精度为0.79,召回0.80,F1得分0.79和MCC 0.79的最佳水平标准。这对我们将其比较的尖端方法进行了重大改进。通过使用深度学习和贝叶斯优化方法来调整超参数,我们还符合ROC-AUC D 0.94,精度D 0.80,召回D 0.82,F1分数D 0.81和MCC D 0.81。
背景:希望有效的生活方式干预措施可预防GDM并减少相关的不良后果,因此希望早期鉴定出患有妊娠糖尿病(GDM)高风险的孕妇。可以使用风险前字典模型来确定怀孕期间开发GDM的个性化概率。这些模型从传统统计数据扩展到机器学习方法;但是,准确性仍然是最佳的。目标:我们旨在比较多个机器学习算法以开发GDM风险预测模型,然后确定预测GDM的最佳模型。方法:从2016年1月至2021年6月的大型卫生服务网络的日常产前护理的数据进行了监督的机器学习预测分析。预测指标集1来自现有的国际验证的Monash GDM模型:GDM历史,体重指数,种族,年龄,糖尿病的家族史以及过去的不良产科历史。具有不同预测因子的新模型,考虑了统计原理,其中包括更健壮的连续变量和衍生变量。随机选择的80%数据集用于模型开发,验证为20%。绩效指标,包括校准和歧视指标。进行决策曲线分析。结果:在内部验证后,机器学习和逻辑回归模型在曲线下的区域(AUC)的区域在不同算法中的范围从71%到93%,最好是Catboost分类器(CBC)。Based on the default cut-off point of 0.32, the performance of CBC on predictor set 4 was: Accuracy (85%), Precision (90%), Recall (78%), F1-score (84%), Sensitivity (81%), Specificity (90%), positive predictive value (92%), negative predictive value (78%), and Brier Score (0.39).结论:在这项研究中,机器学习方法在传统统计方法上实现了最佳的预测性能,从75%增加到93%。catboost分类器方法通过包括连续变量的模型达到了最佳状态。
方法:我们选择了越南中部地区疾病负担较重的七种传染病类别:蚊媒疾病、急性胃肠炎、呼吸道感染、肺结核、败血症、原发性神经系统感染和病毒性肝炎。我们开发了一套问卷,收集疑似传染病患者的当前症状和病史信息。我们使用从 1,129 名患者收集的数据来开发和测试诊断模型。我们使用 XGBoost、LightGBM 和 CatBoost 算法来创建用于临床决策支持的人工智能。我们使用 4 倍交叉验证方法来验证人工智能模型。经过 4 倍交叉验证后,我们在单独的测试数据集上测试了人工智能模型,并估计了每个模型的诊断准确性。
方法:我们选择了越南中部地区疾病负担较重的七种传染病类别:蚊媒疾病、急性胃肠炎、呼吸道感染、肺结核、败血症、原发性神经系统感染和病毒性肝炎。我们开发了一套问卷,收集疑似传染病患者的当前症状和病史信息。我们使用从 1,129 名患者收集的数据来开发和测试诊断模型。我们使用 XGBoost、LightGBM 和 CatBoost 算法来创建用于临床决策支持的人工智能。我们使用 4 倍交叉验证方法来验证人工智能模型。经过 4 倍交叉验证后,我们在单独的测试数据集上测试了人工智能模型,并估计了每个模型的诊断准确性。
今天,成为营销人员并不是一件容易的事,因为它需要指导与客户的相关互动并推动业务成功。这在传统营销领域尤其具有挑战性。在过去的几年中,营销人员观察到,他们在宣传自己的品牌或服务上花费了大量资金,而没有得到收到直接邮件的客户的回应。对听众的缺乏知识使得很难从非相互作用的人中识别出互动者,从而使营销人员觉得自己盲目营销。他们在不知道是否在正确的时间到达合适的受众,这进一步使问题复杂化并延长了创建订婚并为其品牌或服务建立受众的过程。任何营销人员的主要目标是降低成本并增加收入。随着在不同领域(例如保险领域)的服务和通信技术的广泛数字化,在线平台每天都会生产大量有关客户行为的数据。多亏了这种信息来源,并且在市场上的新挑战的推动下,实现了一种更准确,更聪明的营销方法,这在研究人员和公司中越来越多。本研究根据高级功能工程方法和机器学习技术的组合提出了一个智能系统。建议的精确制作系统的目的是帮助管理人员根据潜在特征来辨别客户类别。首先,通过提取一系列数据功能(包括基本属性和消费属性)来开发全面的客户角色。然后,我们评估了各种算法的有效性,例如Catboost,Xgboost,Random Forest(RF),K-最近的邻居(K-NN),Nave Bayes(NB)和支持向量机(SVM)方法,以预测现有客户对下一份产品的响应。采用各种特征选择技术来确定最重要的功能。此外,评估并比较了所使用的模型的性能。结果表明,Catboost的精度,Kappa,Precision,Fmeasure和AUC值分别为0.871、0.711、0.94、0.822和0.85,表现优于其他模型。为了说明我们提出的精确制造系统的优势,我们使用了美国保险公司的现实数据集作为案例研究。关键字:精确营销,机器学习,功能工程,大数据分析,客户
摘要这篇全面的评论探讨了集合机器学习技术在定量结构 - 活性关系(QSAR)建模中的关键作用。它强调了准确的QSAR模型在简化候选化合物选择方面的重要性,并突出了合奏方法,包括Adaboost,梯度增强,随机森林,额外树木,XGBoost,LightGBM和Catboost的重要性,有效地解决了诸如过度拟合和噪声数据的挑战。该评论介绍了集合学习在QSAR内的分类和回归任务中的最新应用,从而在不同的数据集和目标属性中展示了这些技术的出色预测准确性。它还讨论了整体QSAR建模中的关键挑战和考虑因素,包括数据质量,模型选择,计算资源和过度拟合。审查概述了集成QSAR建模的未来方向,包括多模式数据的集成,解释性,处理不平衡的数据,自动化和个性化医学应用,同时强调了在此演变领域中对伦理和监管指南的需求。
1机器人学系1 Ambalika技术研究所,勒克瑙摘要:预测维护(PDM)的目标是一种战略策略,是通过采用数据驱动的策略来预测问题来有效地管理资产维护。此过程涉及随着时间的推移收集数据以监视设备的状况,以确定可以帮助预测和预防问题的模式和相关性。在制造业中,机器通常在没有计划的维护时间表的情况下运行,这会导致由于计划外的不良功能而导致意外的停机时间。为了防止计划外的故障,计划的维护需要以预定的间隔检查机械状态并替换有缺陷的零件。但是,此策略提高了维护费用和机器停机时间。对PDM技术的重点可以降低停机时间的成本并提高工业设备的可用性(利用率),随着行业4.0和智能系统的兴起而增加。此外,通过优化组件有用寿命,PDM具有实现生产可持续实践的潜力。已经对有监督的学习方法进行了分析,例如梯度提升分类器,catboost分类器,轻度梯度提升机和极端的梯度提升。
摘要。随着能源需求继续上升,可再生能源(例如光伏(PV)系统)越来越流行。PV系统将太阳辐射转换为电力,使其成为减少传统电源依赖并减少碳排放的有吸引力的选择。为了优化PV系统的使用,智能预测算法至关重要。他们可以更好地制定有关成本和能源效率,可靠性,功率优化和经济智能电网操作的决策。机器学习算法已被证明可以有效地估算PV系统的功率,从而通过允许模型了解参数之间的复杂关系并评估光伏电池的输出功率性能来提高准确性。这项工作介绍了一项有关使用机器学习算法Catboost,LightGBM,XGBoost和随机森林的研究,以改善预测。研究结果表明,使用机器学习算法LightGBM可以提高PV功率预测的准确性,这可能对优化能源使用具有重要意义。除了降低不确定性外,机器学习算法还提高了PV Systems的效率,可靠性和经济可行性,从而使它们作为可再生能源更具吸引力。
超导是凝聚态物理学中一个引人注目的现象,它包含一系列令人着迷的特性,有望彻底改变能源相关技术和相关的基础研究。然而,该领域面临着在室温下实现超导的挑战。近年来,人工智能 (AI) 方法已成为预测转变温度 (T c ) 等特性的有前途的工具,从而能够快速筛选大型数据库以发现新的超导材料。本研究使用 SuperCon 数据集作为最大的超导材料数据集。然后,我们执行各种数据预处理步骤来导出干净的 DataG 数据集,其中包含 13022 种化合物。在研究的另一个阶段,我们应用新颖的 CatBoost 算法来预测新型超导材料的转变温度。此外,我们开发了一个名为 Jabir 的包,它可以生成 322 个原子描述符。我们还设计了一种名为 Soraya 包的创新混合方法来从特征空间中选择最关键的特征。这些结果得出的 R 2 和 RMSE 值(分别为 0.952 和 6.45 K)优于文献中先前报道的值。最后,作为对该领域的一项新贡献,设计了一个用于预测和确定超导材料 T c 值的 Web 应用程序。