摘要:中风是一种危险的医学障碍,当血液流向大脑的流动被破坏时,会导致神经系统障碍。这是全球范围内的巨大威胁,具有严重的健康和经济影响。为了解决这个问题,研究人员正在开发自动中风预测算法,这将允许早期干预甚至可以挽救生命。随着人口年龄的增长,处于中风风险的人数正在增长,使精确有效的预测系统越来越关键。wo在与六个众所周知的分类器的比较检查中,根据与概括能力和预测准确性有关的指标,探索了所提出的ML技术的有效性。在本研究中,我们还研究了两种可解释的技术,即形状和石灰。Shap(Shapley添加说明)和石灰(局部可解释的模型 - 不合Snostic解释)是建立良好且可靠的方法,用于解释模型决策,尤其是在医疗行业中。实验的发现表明,更复杂的模型优于更简单的模型,顶部模型获得了几乎91%的精度,而其他模型则达到了83-91%的精度。所提出的框架(包括全球和局部可解释的方法)可以帮助标准化复杂的模型并洞悉其决策,从而增强中风护理和治疗。索引术语 - 中风预测,可解释的机器学习,形状,石灰
本研究考察了 2000 年至 2023 年期间气候相关金融政策 (CRFP) 在促进 87 个国家脱碳和可再生能源生产 (REP) 方面的影响。通过采用先进的机器学习方法,并使用政策排序评分 (PSS) 和约束力加权采用指标,该分析为政策设计、经济背景和环境结果之间的复杂关系提供了宝贵的见解。研究结果强调了全球和地区之间的重大差异,为使金融体系与气候目标保持一致提供了可操作的指导。气候相关金融政策对于通过管理气候相关风险和将资本流转向可持续投资来使金融部门与环境目标保持一致至关重要 (D'Orazio & Thole, 2022)。这些政策对于实现《巴黎协定》第 2.1(c) 条至关重要,该条强调将资金流与支持低温室气体 (GHG) 排放和气候适应型发展的途径相结合。绿色债券、强制披露和气候风险评估等工具使金融当局能够减轻系统性风险并促进绿色投资(OECD,2024 年)。例如,绿色债券为可再生能源和能源效率项目提供了大量资金,尤其是在东南亚,尽管将收益分配给海外项目限制了其对当地的影响。同样,强制性的气候风险披露也改变了投资模式,对碳密集型行业征收了“碳风险溢价”。在此背景下,绿色金融原则、披露要求和审慎监管的作用不容小觑。欧洲和亚洲部分地区的金融当局已经引入了强制性披露制度,以解决市场效率低下问题并激励绿色技术创新。这些措施直接影响了碳密集型行业的信誉,将资本流向低碳替代品。该研究采用机器学习技术,包括 Shapley 加法解释 (SHAP),来评估 CRFP 对二氧化碳排放和 REP 等关键环境指标的影响(Lundberg,2017 年)。政策排序评分 (PSS) 量化一个国家与全球最佳实践的政策一致性,而累积政策指数 × 约束力 (CumBind) 则评估政策实施的可执行性和强度。这些指标使我们可以对不同国家组和经济背景进行细致入微的分析。利用这些方法,该研究克服了传统计量经济学的局限性,从而可以更动态地理解因果关系和政策协同作用(Mullainathan, S. & Spiess, 2017)。研究结果表明,发达经济体受益于结构化政策和强有力的机构,这些政策和机构持续推动减少排放和增加可再生能源生产。对于 G20 和 OECD 国家而言,这种影响在具有强大执行机制的经济体中尤为明显,这些经济体的强制披露和绿色金融原则等政策已导致投资模式发生可衡量的变化。然而,在政策采用的更高水平上观察到收益递减,这凸显了持续创新以维持进步的必要性。另一方面,新兴市场和发展中经济体 (EMDE) 面临着限制政策有效性的制度和结构性制约因素。尽管存在这些挑战,EMDE 中的有针对性的 CRFP 仍显示出巨大的潜力,特别是在撒哈拉以南非洲和南亚,这些地区的可再生能源增长引人注目。图 1 全面分析了 CRFP 对 CO2 排放和 REP 的区域影响。面板 A 和 B 中拟合的 SHAP 值说明了政策排序分数 (PSS) 的区域特定趋势。面板 A 显示,随着 PSS 的增加,东亚和太平洋地区的 CO2 排放 SHAP 值急剧下降,表明排序与减排之间存在很强的关系。相反,拉丁美洲和加勒比地区的 SHAP 值急剧上升,反映出有效排序的困难。面板 B 显示,撒哈拉以南非洲地区的 PSS 和 REP 之间存在非线性正相关关系,突显出对改进排序的显著响应,而东亚和太平洋地区则呈现出较为平缓的趋势,表明由于已经很先进的可再生能源部门,边际收益正在递减。面板 C 和 D 研究了约束力加权政策 (CumBind) 的影响。面板 C 发现,在南亚、拉丁美洲和加勒比地区等地区,CumBind 与 CO2 排放之间存在正相关关系,表明存在实施差距或对碳密集型产业的依赖。相比之下,欧洲和中亚呈现下降趋势,反映出更成熟的政策格局。小组 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚地区可再生能源发电增长方面发挥的关键作用,强调了它们在扩大可再生能源产能方面的重要性。尽管存在这些挑战,EMDE 中的有针对性的 CRFP 仍显示出巨大的潜力,特别是在可再生能源增长显著的撒哈拉以南非洲和南亚。图 1 全面分析了 CRFP 对 CO2 排放和 REP 的区域影响。面板 A 和 B 中拟合的 SHAP 值说明了政策排序评分 (PSS) 的区域特定趋势。面板 A 显示,随着 PSS 的增加,东亚和太平洋地区的 CO2 排放 SHAP 值急剧下降,表明排序与减排之间存在很强的关系。相反,拉丁美洲和加勒比地区的 SHAP 值急剧上升,反映出有效排序的困难。面板 B 显示,撒哈拉以南非洲的 PSS 和 REP 之间存在非线性正相关关系,突显出对改进排序的显著响应,而东亚和太平洋地区则呈现出较平缓的趋势,表明由于已经很先进的可再生能源部门,边际收益正在递减。面板 C 和 D 研究了约束加权政策 (CumBind) 的影响。面板 C 表明,在南亚、拉丁美洲和加勒比地区等地区,CumBind 与二氧化碳排放量之间存在正相关关系,表明存在实施差距或对碳密集型行业的依赖。相比之下,欧洲和中亚呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚 REP 增长方面的关键作用,强调了它们在扩大可再生能源容量方面的重要性。尽管存在这些挑战,EMDE 中的有针对性的 CRFP 仍显示出巨大的潜力,特别是在可再生能源增长显著的撒哈拉以南非洲和南亚。图 1 全面分析了 CRFP 对 CO2 排放和 REP 的区域影响。面板 A 和 B 中拟合的 SHAP 值说明了政策排序评分 (PSS) 的区域特定趋势。面板 A 显示,随着 PSS 的增加,东亚和太平洋地区的 CO2 排放 SHAP 值急剧下降,表明排序与减排之间存在很强的关系。相反,拉丁美洲和加勒比地区的 SHAP 值急剧上升,反映出有效排序的困难。面板 B 显示,撒哈拉以南非洲的 PSS 和 REP 之间存在非线性正相关关系,突显出对改进排序的显著响应,而东亚和太平洋地区则呈现出较平缓的趋势,表明由于已经很先进的可再生能源部门,边际收益正在递减。面板 C 和 D 研究了约束加权政策 (CumBind) 的影响。面板 C 表明,在南亚、拉丁美洲和加勒比地区等地区,CumBind 与二氧化碳排放量之间存在正相关关系,表明存在实施差距或对碳密集型行业的依赖。相比之下,欧洲和中亚呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚 REP 增长方面的关键作用,强调了它们在扩大可再生能源容量方面的重要性。这表明存在执行差距或依赖碳密集型行业。相比之下,欧洲和中亚地区则呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚地区可再生能源发电增长方面的关键作用,强调了它们在扩大可再生能源产能方面的重要性。这表明存在执行差距或依赖碳密集型行业。相比之下,欧洲和中亚地区则呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚地区可再生能源发电增长方面的关键作用,强调了它们在扩大可再生能源产能方面的重要性。
SARS-CoV-2 3CLpro 蛋白是 COVID-19 的主要治疗靶点之一,因为它在病毒复制中起着关键作用,具有各种高质量的蛋白质晶体结构,并可作为计算筛选具有改进的抑制活性、生物利用度和 ADMETox 特性的化合物的基础。ChEMBL 和 PubChem 数据库包含筛选针对 SARS-CoV-2 3CLpro 的小分子的实验数据,这扩大了学习模式和设计计算模型的机会,该模型可以在体外和体内测试之前预测任何药物化合物对抗冠状病毒的效力。在这项研究中,我们利用几个描述符评估了 27 个机器学习分类器。我们还开发了一个神经网络模型,该模型可以在 CheMBL 数据上以 91% 的准确率正确识别生物活性和非活性化学物质,在 CheMBL 和 Pubchem 的组合数据上以 93% 的准确率正确识别生物活性和非活性化学物质。非活性和活性化合物的 F1 分数分别为 93% 和 94%。在 XGB 分类器上使用 SHAP (SHapley Additive exPlanations) 从 PaDEL 描述符中找出此任务的重要指纹。结果表明,PaDEL 描述符在预测生物活性方面是有效的,所提出的神经网络设计是有效的,并且通过 SHAP 的解释因子正确地识别了重要的指纹。此外,我们使用包含超过 100,000 个分子的大型数据集验证了我们提出的模型的有效性。本研究采用了各种分子描述符来发现最适合此任务的描述符。为了评估这些可能的药物对抗 SARS-CoV-2 的有效性,需要进行更多的体外和体内研究。
抽象背景在机械血栓切除术(MT)后,急性缺血性中风(AIS)患者的临床结局差异很高。方法217个在2018年8月至2022年1月之间接受MT的前循环大血管闭塞的连续患者。主要结果是功能独立性定义为3个月时修改的Rankin量表得分为0-2。在派生队列中(2018年8月至2020年12月),对70%的患者进行了7个合奏ML模型,并对剩余的30%进行了测试。该模型的性能得到了时间验证队列的进一步验证(2021年1月至2022年1月)。Shapley添加说明(SHAP)框架用于解释预测模型。结果衍生分析产生的9个项目得分(PFCML-MT)包括年龄,国家健康研究所中风量表评分,侧支状态和术后实验室指数(白蛋白与全球蛋白的比例,估计的肾小球过滤率,血液中性粒细胞计数,C-粒细胞计数,C-核酸蛋白质,蛋白质蛋白蛋白,蛋白蛋白胶蛋白,蛋白蛋白蛋白含量和水平。测试集的曲线下面的面积为0.87,时间验证队列为0.84。塑造分析进一步确定了顶部连续特征的阈值。该模型已翻译成一个在线计算器,该计算器可以免费提供给公众(https://zhelvyao-123-60-sial5s.streamlitapp.com)。使用ML和易于使用的功能的结论,我们开发了一种ML模型,该模型有可能在临床实践中使用,以产生对用MT治疗的AIS患者结果的实时,准确的预测。
摘要 - 机器学习确定来自数据的模式,以加快决策过程。基于事实的决策和数据驱动的决策由行业专家指定。由于医疗保健中机器语言模型的持续增长,它们在ML模型中繁殖了连续的复杂性和黑匣子。为了使ML模型晶体清晰且可实现的解释,AI登录率很高。这项研究审查了印度医疗保健系统中可解释的AI和能力检测糖尿病。石灰和外形是两个用于实现可解释AI的库和软件包。密封的基础合并局部和全局可解释的方法,从而增强了复杂模型的结晶度,并从复杂模型中获得了对公平性的直觉。此外,所获得的直觉还可以促进临床数据科学家计划对计算机辅助诊断的更奇怪的组成。XAI对预测顽固疾病的重要性。 在这种情况下,顽固的糖尿病,血浆与胰岛素与胰岛素之间的相关性,年龄与妊娠,类(糖尿病和非糖尿病患者)与血浆葡萄糖的相关性持续存在着牢固的关系。 具有塑形值的PIMD(PIMA印度糖尿病数据集)用于简洁依赖性,而当同时需要特征的锚定和重要性时,石灰是适用的。 依赖图可帮助医生可视化与预测疾病的独立关系。 要识别不同属性的依赖性,使用相关热图。XAI对预测顽固疾病的重要性。在这种情况下,顽固的糖尿病,血浆与胰岛素与胰岛素之间的相关性,年龄与妊娠,类(糖尿病和非糖尿病患者)与血浆葡萄糖的相关性持续存在着牢固的关系。具有塑形值的PIMD(PIMA印度糖尿病数据集)用于简洁依赖性,而当同时需要特征的锚定和重要性时,石灰是适用的。依赖图可帮助医生可视化与预测疾病的独立关系。要识别不同属性的依赖性,使用相关热图。从学术的角度来看,Xai在不久的将来对成熟是必不可少的。估算了其他适用数据集对应研究的介绍,这是非常学徒的。
背景:大鼠模型由于其成本效益以及与人类的显着生理和遗传相似性而广泛用于研究白内障,这项研究的目的是确定由于大鼠的半乳糖暴露而导致白内障的基因。方法:我们分析了来自基因表达综合的四个数据集,包括不同大鼠菌株中白内障的离体和体内模型。特征选择工具用于识别与白内障相关基因表达中潜在相关的基因。实施了决策树算法,并使用摇动和石灰来解释其预测。为了验证基因表达水平,在M199培养基中培养的六个大鼠透镜上进行了PCR,仅在M199中诱导白内障和六个镜片。结果:使用特征选择工具,四个关键基因 - plagl2,cmtm7,pcyt1b和nr1d2。在分析的数据集之间,只有白内障和对照组之间的PCYT1B显着差异。该模型显示出强大的预测性能,尤其是在离体数据集中。摇摆和石灰分析表明,CMTM7对模型预测的影响最大。PCR结果没有显示白内障和对照组之间基因表达的显着差异。结论:在体内数据集中训练的决策树模型可以预测过体内和体内白内障,尽管白内障和对照组之间没有发现显着的基因表达差异。给定少量样本,需要进行较大的研究来验证我们的发现。
2,Lindenwood University https://orcid.org/0000-0002-0578-6052摘要:深神经网络(DNN)的可解释性和解释性在人工智能(AI)中至关重要,尤其是应用于医疗保健,财务,财务,财务,自然驾驶和自动驾驶和自动驾驶。这项研究的需求源于AI逐渐融合到关键领域,在这些领域中,透明,信任和道德决策至关重要。本文探讨了建筑设计选择对DNN解释性的影响,重点介绍了不同的建筑元素(例如层类型,网络深度,连接模式和注意机制)如何影响模型透明度。从方法论上讲,该研究对案例研究和实验结果进行了全面综述,以分析DNN中的性能与可解释性之间的平衡。它检查了现实世界中的应用程序,以证明医疗保健,金融和自动驾驶等领域的可解释性重要性。该研究还综述了实用工具,例如局部可解释的模型不合源说明(LIME)和Shapley添加说明(SHAP),以评估它们在增强模型透明度方面的有效性。结果强调了解释性有助于更好的决策,问责制和遵守监管标准。例如,在环境监测中使用Shap有助于政策制定者了解空气质量的关键动力,从而导致明智的干预措施。在教育中,石灰通过强调影响学生绩效的因素来帮助教育者个性化学习。研究结果还表明,结合注意机制和混合模型体系结构可以显着提高可解释性,而不会损害性能。关键字:解释性,解释性,深神经网络,AI透明度
抽象的农艺师和生产商通常固有地知道季节性和场内作物变异性的关键驱动因素。然而,随着全球对更可持续和生产性粮食系统的需求不断增长,了解和量化它们对于最大程度地提高投入效率和生产力潜力至关重要。这项研究的重点是位于新南威尔士州Moree(新南威尔士州)西部1099公顷的案例研究领域,那里有10个以上的收益率数据。数字土壤图是由关键土壤特性和约束产生的(例如使用野外收集的土壤数据在四个深度至0.9 m的土壤数据以及近端和远程感知的空间数据的情况下,使用了水的能力。使用LIDAR数据以1 m分辨率创建了场的高程图。Xgboost模型,具有土壤和高程预测因子为变量,用于预测每个季节的产量。然后使用Shapley添加说明(SHAP)来解释输出,并通过确定和映射预测变量的最负面值来解释最有限变量的图。然后确定田间每个点的最限制因素(小麦或鹰嘴豆),以及季节性潮湿或干季。结果在生产最有限的限制中显示出一些一致的趋势。“湿”季节产生了最不一致的趋势,因为在不同的农作物阶段或作物类型上,供水事件的影响和严重程度变化。此外,还检查了一个案例研究季节,以了解尿素管理决定对作物产量的可变率的影响。总体而言,这项研究表明,解释性机器学习对于理解和量化时空影响作物变异性非常有用,这将在未来改善作物管理。
抽象目标旨在通过使用大型样本数据集进行机器学习来研究糖尿病性视网膜病(DR)风险因素和预测模型。基于大型样本和高维数据库的设计回顾性研究。在北京设立中国中央三级医院。参与者有关32 452型糖尿病(T2DM)住院患者的信息从2013年1月1日至2017年12月31日从电子病历系统中检索方法保留了六十个变量(包括人口统计信息,物理和实验室测量,系统疾病和胰岛素治疗)进行基线分析。通过递归特征消除选择了最佳17变量。预测模型是基于XGBoost算法构建的,并与其他三种流行的机器学习技术进行了比较:逻辑回归,随机森林和支持向量机。为了更视觉上解释XGBoost模型的结果,使用了Shapley添加说明(SHAP)方法。结果DR发生在2038年(6.28%)T2DM患者中。XGBoost模型被确定为具有最高AUC的最佳预测模型(曲线值为0.90),表明HBA1C值大于8%,肾病,血清肌酐值大于100 µmol/L,胰岛素治疗和糖尿病下极端疾病的风险与DR的风险增加相关。患者的年龄超过65岁,与DR的风险降低有关。结论具有更好的全面性能,XGBoost模型具有很高的可靠性来评估DR的风险指标。可以通过Shap方法找到DR的最关键危险因素和危险因素的临界因素,以使XGBoost模型的输出在临床上可以解释。
摘要:随着解释机器学习(ML)模型的兴趣越来越多,本文综合了许多与ML解释性相关的主题。我们将解释性与解释性,本地解释性以及功能重要性与功能相关性区分开。我们演示和可视化不同的解释方法,如何解释它们,并提供完整的Python软件包(Scikit-templain),以允许未来的研究人员和模型开发人员探索这些解释能力方法。解释性方法包括Shapley添加性解释(SHAP),Shapley添加剂全球解释(SAGE)和累积的局部效应(ALE)。我们的重点主要放在基于沙普利的技术上,这些技术是增强模型解释性的各种现有方法的统一框架。例如,制造一致的方法,例如可解释的模型 - 不合Snostic解释(lime)和树解释器,用于局部解释性,而鼠尾草则统一了对全球解释性的置换重要性的不同变化。我们提供了一个简短的教程,用于使用三个不同数据集解释ML模型:用于对流的模型数据集用于恶劣天气预测,一个用于子冷冻道路表面预测的幕后数据集,以及用于雷电预测的基于卫星的数据。此外,我们还展示了相关特征对模型的解释性的不利影响。最后,我们演示了评估特征组的模型图案而不是单个特征的概念。评估特征组可减轻特征相关性的影响,并可以对模型提供更全面的理解。本研究中使用的所有代码,模型和数据都可以自由使用,以加速大气和其他环境科学中的机器学习解释性。