我们使用基于 SHapley 加法解释 (SHAP)、局部可解释模型不可知解释 (LIME) 和光梯度增强机 (LightGBM) 的最新可解释人工智能 (XAI) 来分析各种物理农业 (农业) 工人数据集。我们开发了各种有前景的身体感应系统,以增强农业技术进步、培训和工人发展以及安全性。然而,现有的方法和系统不足以深入分析人体运动。因此,我们还开发了可穿戴传感系统 (WS),它可以通过分析不同农田、草地和花园中的人体动态和统计数据来捕获与农业工人运动相关的实时三轴加速度和角速度数据。在使用用 Python 编写的新程序调查获得的时间序列数据后,我们与真正的农业工人和管理人员讨论了我们的发现和建议。在本研究中,我们使用 XAI 和可视化来分析有经验和缺乏经验的农业工人的多样化数据,以开发一种供农业主管培训农业工人的应用方法。
摘要:现有的降水类型算法很难辨别出冰冻雨水和冰球的发生。这些固有的偏见不仅在操作预测中是有问题的,而且使基于模型的降水类型气候的发展变得复杂。为了解决这些问题,本文介绍了一种新型的轻梯度增强机(LightGBM)基于基于的机器学习降水型算法,该算法利用重新分析和表面观测。通过将其与布尔戈因降水类型算法作为基线进行比较,我们证明了我们的算法改善了所有检查的降水类型的关键成功指数(CSI)。此外,与重新分析中的降水类型诊断相比,我们的算法表现出降雪,冷冻雨和冰颗粒的F1评分。随后,我们利用该算法来计算美国东部的冻结气候。由此产生的气候模式与观察良好吻合;但是,观察到显着的平均偏见。我们将这种偏见解释为对算法本身和关于降水过程的假设的影响,包括与冻伤,降水发生和区域概要天气模式有关的偏见。为了减轻整体偏差,我们提出将降水量从0.04增加到0.25 mm H 2 1,因为它更好地反映了沉淀观测的精度。这种调整可大大减少整体偏差。最后,鉴于LightGBM在预测混合降水事件方面的出色表现,我们预计该算法可以在操作环境中有效利用,并在气候模型输出中诊断降水类型。
摘要:疟疾继续构成重大的全球健康威胁,抗药性疟疾的出现加剧了挑战,强调了对新抗疟药的迫切需求。虽然已经将几种机器学习算法应用于抗性化合物的定量结构 - 活性关系(QSAR)建模,但仍需要更需要进行更可解释的模拟,以提供有关药物作用的潜在机制,从而促进新化合物的合理设计。本研究使用轻梯度增强机(LightGBM)开发了QSAR模型。该模型与沙普利添加剂解释(SHAP)集成在一起,以增强可靠性。LightGBM模型在预测抗性激活方面表现出了卓越的性能,其AC屏性为86%,精度为85%,灵敏度为81%,特异性为89%,F1得分为83%。SHAP分析确定关键分子描述符,例如MaxDO和GATS2M,是抗疟疾活性的重要促进者。LightGBM与Shap的整合不仅增强了QSAR模型的预测性交流性,而且还为特征的重要性提供了宝贵的见解,从而有助于新的抗疟药的合理设计。这种方法弥合了模型准确性和可解释性之间的差距,为有效有效的药物疾病提供了强大的框架,以抵抗耐药性疟疾菌株。
一般而言,LightGBM,Xgboost,随机森林和逐步增强模型的表现优于内部阀门。同时,采用LightGBM(0.96),XGBoost(0.92)和随机森林(0.92)的模型,较高的AUC值。关于灵敏度,逻辑回归(0.64)和LightGBM(0.57)模型的性能更好。虽然,KNN,随机森林,SVM和梯度增强模型达到了特异性和正面值1。此外,LightGBM(0.90),决策树(0.88)和逻辑回归(0.88)模型表现出更高的负预测值。使用LightGBM,XGBoost和随机森林组合歧视和校准,Brier得分分别为0.07、0.10和0.10(表3,图3,图。4,图S18 – S19)。
解决分类和预测挑战,树木集成模型已获得了重要的重要性。促进集合技术是用于预测II型糖尿病的综合技术。光梯度提升机(LightGBM)是一种以其叶片生长策略,减少损失和增强的训练精度而闻名的算法。但是,LightGBM容易过度拟合。相比之下,Catboost使用了称为决策表的平衡基础预测值,该预测值可以减轻过度适应风险,并明显提高测试时间效率。catboost的算法结构抵消了梯度增强偏见,并结合了过度拟合的检测器以尽早停止训练。本研究的重点是开发一种混合模型,该模型结合了LightGBM和Catboost,以最大程度地减少过度拟合并通过降低方差改善效果。为了找到与基础学习者一起使用的最佳超级仪表,使用了贝叶斯超级参数操作方法。通过微调正则化参数阀,混合模型有效地降低了方差(过拟合)。针对LightGBM,Catboost,Xgboost,Deciest Crey,Random Forest,Adaboost和GBM算法的比较评估表明,混合模型具有最佳的F1得分(99.37%),召回率(99.25%)和准确性(99.37%)。因此,拟议中的框架对医疗保健行业的早期糖尿病有望有望,并显示出与糖尿病共享相似性的其他数据集的潜在适用性。
摘要:金融当局要求银行的信用评分模型具有可解释性。本文提出了一种可解释的人工智能 (XAI) 模型,用于预测挪威银行提供的无担保消费贷款独特数据集上的信用违约。我们将 LightGBM 模型与 SHAP 相结合,从而能够解释影响预测的解释变量。LightGBM 模型明显优于银行的实际信用评分模型(逻辑回归)。我们发现,LightGBM 模型中预测违约的最重要解释变量是已用信用余额的波动性、剩余信用占总信用的百分比以及客户关系的持续时间。我们的主要贡献是在银行业实施 XAI 方法,探索如何应用这些方法来提高最先进的 AI 模型的可解释性和可靠性。我们还提出了一种分析改进的信用评分模型的潜在经济价值的方法。
4 近年来,XGBoost(Chen and Guestrin 2016)和LightGBM(Ke et al.2017),但规模相对较小
这项研究使用ICD-9代码从模仿数据库中确定了18岁以上的1,177例患者。预处理包括处理丢失的数据,删除重复项,处理偏度和过度采样以减轻数据失衡。通过检查方差通胀因子(VIF)值,套索回归和单变量分析,在LightGBM模型中选择了18个特征。与其他基线模型相比,LASSO逻辑回归模型的最终输出的最高测试AUC -ROC为0.8766(95%CI 0.8065-0.9429),准确性为0.7291,包括随机森林,LightGBM,支持载体机(SVM)和决策树。所有模型均表现出良好的校准,其Brier得分相对较低,突出了它们在预测院内死亡率方面的可靠性。
摘要:该研究主要集中于使用机器学习方法来识别银行数据中的欺诈活动。这是金融部门的关键问题,在金融部门,检测和防止欺诈性交易至关重要。为了改善欺诈检测,该研究介绍了班级体重量大超参数。这些参数有助于模型更有效地区分合法和欺诈交易,从而增强了欺诈检测系统的准确性。这项研究从战略上采用了三种流行的机器学习算法:Catboost,LightGBM和XGBoost。每个算法都具有独特的优势,它们的综合用途旨在提高欺诈检测方法的整体性能。深度学习技术被整合到研究中以微调超参数。这种集成增强了欺诈检测系统的性能和适应性,使其在识别不断发展的欺诈策略方面更有效。该项目使用现实世界数据进行彻底评估。这些评估表明,在评估各种标准时,LightGBM和XGBoost的联合使用优于现有方法。这表明与其他方法相比,所提出的方法在检测欺诈活动方面更有效。包括,已经实现了一个堆叠分类器,将RandomForest和LightGBM分类器的预测与特定的设置相结合。使用梯度BoostingClassifier作为最终估计器,通过利用各种模型的优势来提高预测准确性。索引术语 - 贝叶斯优化,数据挖掘,深度学习,整体学习,超级参数,不平衡数据,机器学习。