摘要。目标:本研究的目的是利用机器学习来检查训练负荷与足球伤害之间的关系,并通过一个英国英超俱乐部的多赛季数据集。方法:参与者是35名男性职业足球运动员(年龄25.79±3。75年,范围18-37岁;高度1.80±0.07 m,范围1.63–1.95 m;重量80.70±6.78 kg,范围为66.03-93.70 kg),范围为66.03–93.70 kg),与2014 – 2014 – 2014 – 2014 – 2014 – 2014年一起收集到2014年季度。对133例非接触式伤害进行了检查,总共检查了106个培训负载变量(40个GPS数据,6个个人信息,14个物理数据,4个心理数据,14个ACWR,14 MSWR和14个EWMA数据),高失衡率为0.013。结果:实施了XGBoost和人工神经网络,以使用四个半季节的数据来训练机器学习模型,随后开发的模型随后对下半年的数据进行了测试。在第一个半赛季中,有341次受伤;在接下来的半赛季中,有37次受伤。要解释和可视化每个模型的输出以及每个功能(即训练负载)对模型的贡献,我们使用了Shapley添加说明(SHAP)方法。37次伤害,XGBOOST正确预测了26次伤害,召回和精度分别为73%和10%。 人工神经网络正确预测了28次伤害,召回和精度分别为77%和13%。 在模型中使用人工神经网络(相对精确的模型),最后的伤害区域和重量似乎是导致损伤预测的最重要特征。37次伤害,XGBOOST正确预测了26次伤害,召回和精度分别为73%和10%。人工神经网络正确预测了28次伤害,召回和精度分别为77%和13%。在模型中使用人工神经网络(相对精确的模型),最后的伤害区域和重量似乎是导致损伤预测的最重要特征。结论:这是使用人工神经网络和多季节数据集进行伤害预测的第一项研究。我们的结果表明,有可能预测高召回率的伤害,从而确定大多数受伤病例,尽管由于高阶层失衡,精度受到了损害。这种使用机器学习的方法为足球组织和从业人员监测负荷伤害提供了潜在的有价值的见解。
抽象目标阿尔茨海默氏病(AD)对65岁及65岁以上的个体是最普遍的痴呆形式构成了重大挑战。尽管现有的AD风险预测工具表现出很高的准确性,但它们的复杂性和有限的可访问性限制了实际应用。本研究旨在使用机器学习技术开发一个方便,有效的预测模型。设计和设置我们对来自国家阿尔茨海默氏症协调中心的60岁及60岁以上的参与者进行了横断面研究。我们选择个人特征,临床数据和心理社会因素作为AD的基线预测因子(2015年3月至2021年12月)。这项研究利用随机森林和极端梯度提升(XGBoost)算法以及传统的逻辑回归进行建模。应用了一种超采样方法来平衡数据集。干预措施本研究没有干预措施。参与者研究包括2379名参与者,其中507名被诊断出患有AD。主要和次要结果指标,包括准确性,精度,召回,F1分数等。结果11变量在训练阶段至关重要,包括教育水平,抑郁,失眠,年龄,体重指数(BMI),药物计数,性别,支架,收缩压(SBP),神经症和快速眼动运动。XGBoost模型与其他模型相比表现出色,在曲线下达到0.915,灵敏度为76.2%,特异性为92.9%。最有影响力的预测因素是教育水平,总药物计数,年龄,SBP和BMI。结论拟议的分类器可以帮助指导老年人群中AD的临床前筛查。
摘要 — 近期所谓的深度伪造的现实创作和传播对社会生活、公民休息和法律构成了严重威胁。名人诽谤、选举操纵和深度伪造作为法庭证据只是深度伪造的一些潜在后果。基于 PyTorch 或 TensorFlow 等现代框架、FaceApp 和 REFACE 等视频处理应用程序以及经济的计算基础设施的开源训练模型的可用性简化了深度伪造的创作。大多数现有检测器专注于检测换脸、口型同步或木偶大师深度伪造,但几乎没有探索用于检测所有三种类型深度伪造的统一框架。本文提出了一个统一的框架,利用混合面部标志和我们新颖的心率特征的融合功能来检测所有类型的深度伪造。我们提出了新颖的心率特征,并将它们与面部标志特征融合,以更好地提取假视频的面部伪影和原始视频中的自然变化。我们利用这些特征训练了一个轻量级的 XGBoost,以对 deepfake 和真实视频进行分类。我们在包含所有类型 deepfake 的世界领袖数据集 (WLDR) 上评估了我们框架的性能。实验结果表明,与比较 deepfake 检测方法相比,所提出的框架具有更优异的检测性能。将我们的框架与深度学习模型候选模型 LSTM-FCN 进行性能比较,结果表明,所提出的模型取得了类似的结果,但它更具可解释性。索引术语 —Deepfakes、多媒体取证、随机森林集成、树提升、XGBoost、Faceswap、Lip sync、Puppet Master。
摘要:该研究主要集中于使用机器学习方法来识别银行数据中的欺诈活动。这是金融部门的关键问题,在金融部门,检测和防止欺诈性交易至关重要。为了改善欺诈检测,该研究介绍了班级体重量大超参数。这些参数有助于模型更有效地区分合法和欺诈交易,从而增强了欺诈检测系统的准确性。这项研究从战略上采用了三种流行的机器学习算法:Catboost,LightGBM和XGBoost。每个算法都具有独特的优势,它们的综合用途旨在提高欺诈检测方法的整体性能。深度学习技术被整合到研究中以微调超参数。这种集成增强了欺诈检测系统的性能和适应性,使其在识别不断发展的欺诈策略方面更有效。该项目使用现实世界数据进行彻底评估。这些评估表明,在评估各种标准时,LightGBM和XGBoost的联合使用优于现有方法。这表明与其他方法相比,所提出的方法在检测欺诈活动方面更有效。包括,已经实现了一个堆叠分类器,将RandomForest和LightGBM分类器的预测与特定的设置相结合。使用梯度BoostingClassifier作为最终估计器,通过利用各种模型的优势来提高预测准确性。索引术语 - 贝叶斯优化,数据挖掘,深度学习,整体学习,超级参数,不平衡数据,机器学习。
对化学物质的调节需要了解其对大量物种的毒理作用,这些物种传统上是通过体内测试获得的。最近为基于机器学习寻找替代方案的努力并没有集中于保证透明度,可比性和可重复性,这使得很难评估这些方法的优势和缺点。此外,还需要可比的基线表现。在这项研究中,我们在[Schür等人,《自然科学数据》,2023年提出的Adore“ T-F2F”挑战上训练了回归模型,以预测鱼类上有机化合物的LC50(致命浓度50),以LC50(致命浓度50)测量。我们训练了拉索,随机森林(RF),XGBOOST,高斯工艺(GP)回归模型,并发现了一系列稳定的方面,这些方面均稳定:(i)使用质量或摩尔浓度不会影响性能; (ii)性能仅微弱地取决于化学物质的分子代表,但(iii)强烈地依赖于数据的分解方式。总体而言,基于树的型号RF和XGBoost表现最好,我们能够预测log10转换的LC50,其根平方误差为0.90,这对应于原始LC50量表上的数量级。在本地一级,模型无法始终如一地准确地预测单个化学物质的毒性。对单个化学物质的预测主要受几种化学特性的影响,而分类特性未被模型充分捕获。我们讨论了这些挑战的技术和概念改进,以增强对环境危害评估的适用性。因此,这项工作展示了最先进的模型,并为监管整合的持续讨论做出了贡献。
Asheesh Pandey 1,Sudeshna Chakraborty 2 1研究学者,Shri Venkateshwara University,Gajraula UP,印度Gajraula UP 2研究主管,Shri Venkateshwara University,Gajraula UP,印度Gajraula UP,印度Gajraula摘要:糖尿病是关键的,并且会变得更为复杂的疾病,如果没有足够的管理,可能会引起严重的健康问题。糖尿病的早期诊断和治疗是该疾病的关键组成部分,可以通过数据分析和预测算法极大地帮助糖尿病。通过使用数据挖掘技术(例如分类和预测模型),可以分析糖尿病数据的各种元素,并提取可用于早期检测和预测病情的有用信息。一种可以有效且高度准确预测糖尿病的机器学习技术是XGBoost分类器。此方法利用梯度增强体系结构,可以处理具有独立高维特征集的大型且复杂的数据集。相反,至关重要的是要记住,最佳糖尿病预测算法的选择可能取决于数据的细节以及正在研究的研究领域。数据分析和预测方法不仅可以预测糖尿病,还可以监测疾病的进展,发现糖尿病及其并发症的危险因素,并评估治疗的有效性。通过使用这些技术,医疗专业人员可以对疾病的根本原因获得重要的见解,这有助于他们就患者管理做出明智的决定。关键字:糖尿病,SVM,决策树,AI,ML糖尿病的早期检测和管理是一种正在迅速扩大并带来重大健康风险的慢性疾病,有可能通过应用数据分析和预测算法来显着改善。XGBOOST分类器实现了89%的精确率,这表明性能水平最高。
随着人工智能 (AI) 的不断进步和金融科技的热情高涨,信用评分等应用引起了学术界的广泛兴趣。信用评分是一种帮助金融专家更好地决定是否接受贷款申请的方法,这样违约概率高的贷款就不会被接受。表现良好的信用评分模型能够区分更有可能违约的贷款申请和不太可能违约的贷款申请,这是非常有益的,因为它们减少了贷款审批流程所需的时间,并可以节省大量成本。除了此类信用评分模型面临的嘈杂和高度不平衡的数据挑战之外,最近出台的法规,例如《通用数据保护条例》(GDPR) 和《平等信贷机会法》(ECOA) 引入的“解释权”,也增加了对模型可解释性的需求,以确保算法决策是可以理解和连贯的。因此,这要求黑盒机器学习 (ML) 模型(如 ANN 和 XGBoost)不仅在分类性能上准确,还必须能够解释它们的预测,以便金融专家愿意信任和采用这样的模型。最近提出的一个有趣概念是可解释的人工智能 (XAI),其重点是使黑盒模型更具可解释性和可说明性。多年来,已经提出了多种旨在通过规则或视觉说明来解释 ML 算法预测的 XAI 方法,其中一些是本质上可解释的模型,而另一些是事后可解释性技术。在这项工作中,我们旨在提出一种既准确又可解释的信用评分模型,并且总体上比 Dash 等人 (2018) 提出的最先进的基准通过列生成布尔规则 (BRCG) 方法更好;Dash 等人是 FICO 最新的可解释机器学习挑战赛的获胜者。本工作中进行的实验表明,最先进的 XGBoost 模型比逻辑回归 (LR)、决策树 (DT)、随机森林 (RF) 和人工神经网络 (ANN) 技术以及基准 BRCG 模型表现更好,在 HELOC 数据集上的 ROC 曲线下面积 (AUROC) 为 0.78,在 Lending Club 数据集上的 AUROC 为 0.71。XGBoost 模型通过三种 XAI 技术得到进一步增强;SHAP+GIRP 提供全局解释,Anchors 提供基于局部特征的解释,ProtoDash 提供基于局部实例的解释。这三种类型的解释为可解释性提供了全面的解决方案,因为不同的人在不同情况下需要不同的解释。通过使用功能基础(即通过形式化措施评估)、应用基础(即由人类专家评估)和人为基础(即通过对文献的分析(通常由普通人评估)表明,所提供的解释简单、一致、完整,并且满足了正确性、有效性、易理解性、细节充分性和可信度等六项预定假设。
及早发现癌症对于挽救许多生命至关重要。如果脑瘤被诊断为较高级别,它通常是最常见和最严重的恶性肿瘤之一,预计寿命很短。肿瘤大小、形态和位置的差异对脑瘤的检测造成了重大障碍。本综述旨在为研究人员提供基于磁共振成像 (MRI) 的脑瘤检测的全面文献综述。使用九种机器学习算法对 MRI 图像进行分类:支持向量机 (SVM)、逻辑回归、K 最近邻 (KNN)、朴素贝叶斯 (NB)、决策树 (DT) 分类器、随机森林分类器、XGBoost 分类器、随机梯度下降 (SGD) 分类器和梯度提升分类器。对 ML 算法进行了比较和对比。
摘要 — 脑机接口已被研究了 20 多年,并且具有巨大的开发应用潜力,可供医生诊断疾病或帮助患有严重神经系统疾病的患者恢复与社会互动。要达到这些目的,需要分析脑电图数据的技术以及训练模型以识别模式或控制设备的算法。TensorFlow 是 Google 团队为内部使用而开发的机器学习,于 2015 年向公众发布。由于它可以在深度学习神经网络上进行训练和测试,因此可以用于脑电图数据。该项目使用 TF-Keras 和 TensorFlow-DNN 来训练使用脑电图数据对大脑状态进行分类的模型。Neurosky Mindwave Mobile 耳机和由 Micro:bit 开发的新设备是该项目的脑电图信号记录器。采用了最小-最大归一化、集合经验模态分解 (EEMD)、提取等多种技术来分析记录的脑电图数据。结果表明,在对来自 Micro:bit 设备的 EEG 数据进行分类时,TensorFlow-Keras 和 TensorFlow - DNN 模型的准确率为 97%,而 XGBoost 的结果为 98%。结果证实了 TensorFlow 在识别 EEG 数据方面的应用能力。对上述结果有贡献的数据处理技术是最小最大规范化和数据提取。此外,我们还验证了记录数据中的低频漂移对于使用 EEG 数据识别大脑状态至关重要。结果还显示了使用 EEMD 技术生成的 IMF 作为特征来构建使用 EEG 数据对大脑状态进行分类的模型。索引词 —TensorFlow、EEG、XGBoost、TensorFlow-Keras (TF-Keras)、TensorFlow-DNN (TF-DNN)、集合经验模态分解 (EEMD)、Neurosky、Micro:bit、脑机接口 (BC I)