自格雷格·莫兰(Greg Moran)退休以来,斯科特(Scott)就一直担任临时负责人,但是经过竞争激烈的国家搜索,伦德伯格(Lundberg)博士已被搜索委员会选为常任负责人。斯科特(Scott)就读于斯坦福大学(Stanford University),于1994年毕业于化学学士学位和经济学学士学位。他于1999年从UCSD获得了医学学位,并进入了2004年毕业的5年急诊医学 /内科住院医师计划,并担任首席居民的最后一年。他于2004年加入了Olive View的UCLA教职员工,花时间担任副计划主任,助理医疗总监和医疗总监。他于2018年被提升为加州大学洛杉矶分校的急诊医学临床教授。他担任过OV的许多委员会主席,并在指导医疗中心通过大流行和许多过程变化发挥了作用。他是一位才华横溢的老师,导师和领导者,也是我们最明显的核心教师之一(不仅是因为他大约是6'5”),我非常期待与斯科特(Scott)紧密合作,因为我们继续发展我们的部门,奖学金和居住计划。恭喜Scott!….. Greg Hendey(1993)
1 简介 机器学习 (ML) 模型广泛应用于许多实际应用的决策过程。现代 ML 方法的快速发展、实际成就和整体成功 [LeCun et al. , 2015; Jordan and Mitchell, 2015; Mnih et al. , 2015; ACM, 2018] 保证了机器学习将作为一种通用计算范式盛行,并将找到越来越多的实际应用,其中许多与我们生活的各个方面有关。不幸的是,ML 模型有时会灾难性地失败 [Zhou and Sun, 2019; CACM Letters to the Editor, 2019]。它们还可能由于模型中的偏见(例如种族、性别、年龄)而支持糟糕的决策 [Angwin et al. , 2016]。由于脆弱性,它们的决策可能会令人困惑 [Szegedy et al. , 2017]。 ,2014;Goodfellow 等人,2015]。因此,迫切需要了解 ML 模型的行为,分析模型(或用于训练模型的数据)的(潜在)故障,对其进行调试并可能进行修复。这引起了人们对验证 ML 模型操作的兴趣日益浓厚 [Ruan 等人,2018;Narodytska,2018;Narodytska 等人,2018b;Katz 等人,2017],同时也激发了旨在设计可解释人工智能(XAI)方法的努力 [Ribeiro 等人,2018;Lundberg 和 Lee,2017;Ignatiev 等人,2018;Narodytska 等人,2018a;Ribeiro 等人, 2016;伊格纳季耶夫等人。 , 2019a;
Miraldo A 1§* , Sundh J 2, * , Iwaszkiewicz-EggebrechtE 1 , Buczek M 3 , Goodsell R 1 , Johansson H 4 , Fisher BL 5 , Raharinjanahary D 6 , RajoelisonET 6 , Ranaivo C 6 , Randrianandrasana C 6 , Rafanomezantsoa JJ 6 , ManoharanL 7 , Granqvist E 1 , van Dijk LJA 1 , Alberg L 4 , Åhlén D 8 , Aspebo M 4 , Åström S 4 , BellvikenA 4 , Bergman PE 4 , Björklund S 4 , Björkman MP 9,10 , Deng J 3 , Desborough L 4 , DolffE 4 , Eliasson A 4 , Elmquist H 4 , Emanuelsson H 4 , Erixon R 11 , Fahlen L 4 , Frogner C 4 ,Fürst P 4 , Grabs A 4 , Grudd H 12 , Guasconi D 13 , Gunnarsson M 4 , Häggqvist S 4 , Hed A 4 ,Hörnström E 4 , Johansson H 4 , Jönsson A 4 , Kanerot S 4 , Karlsson A 4 , Karlsson D 4 ,Klinth M 4 , Kraft T 4 , Lahti R 14 , Larsson M 4 , Lernefalk H 4 , Lestander Y 4 , Lindholm LT 4 , LindholmM 4 , Ljung U 4 , Ljung K 4 , Lundberg J 15 , Lundin E 12 , Malmenius M 4 , Marquina D 1,# ,Martinelli J 4 , Mertz L 4 , Nilsson J 4 , Patchett A 16 , Persson N 4 , Persson J 4 , Prus-FrankowskaM 3 , Regazzoni E 4 , Rosander KG 4 , Rydgård M 4 , Sandblom C 4 , Skord J 4 , StålhandskeT 16,17 , Svensson F 4 , Szpryngiel S 1 , Tajani K 17 , Tyboni M 4 , Ugarph C 4 , Vestermark L 4 , Vilhelmsson J 4 , Wahlgren N 4 , Wass A 4 , Wetterstrand P 4 , Łukasik P 1,3,† , Tack AJM 8,† ,Andersson AF 18,† , Roslin T 19,20,† , Ronquist F 1,†
lundberg&Lee(2017)提出了一种统一的方法,以应用局部解释性(单个样本中单个变量的可变分配)和全局解释性(整个模型的可变概述),通过应用Shapley(1953)提出的游戏理论的收益原理的公平分布,通过应用收益原理的公平分布。现在称为Shap(Shapley添加说明),该建议的框架解释了ML模型的预测,其中输入变量代替了玩家,并且使用Shapley值来衡量它们对特定预测的贡献。连续地,Redell(2019)提出了一个度量标准,该指标将Shapley值的添加特性与Gelman(2018)的R平方(R2)的鲁棒性相结合,以产生一个方差分解,以准确地将每个变量对模型的探索功率的贡献进行贡献。我们还使用签名的R2,以表示与线性SEM一致的连接的调节,因为DAG中的边缘表示节点调节(如果阳性;如果抑制,如果为阴性)。使用符号(beta)(即,来自输入节点上的输出节点的线性模型(LM)拟合的系数估计值)的符号已被重新覆盖。此外,为了确定节点调节相对于DAG的局部意义,可以通过将其输入节点的ShapleyR2求和来计算每个结果节点的R-squared值的塑形分解(r = 1,...,...,r)。因此,该函数使用进度条来检查每个观察值的内核形状评估的进度。最后,应该注意的是,计算内核形状值所需的操作本质上是耗时的,计算时间与预测变量数量和观测值的数量成正比。
(Fretheim等,2017)它们可能有助于现场其他特征的空间结构,有时包括假定地板区域(帐篷环)周围的石头安排。在欧洲的背景下,来自挪威各地的挖掘和文献刊登的中石器时代的住宅数量非常出色。这种丰度在很大程度上归功于以前的农业活动或对景观的变化而幸免于遭受破坏的偶然组合,这是一项全国性的遗产法案,确保了在考古学上进行土地发展项目的调查,并在必要时进行(如有必要)进行(如有必要)进行,并且不受限制地覆盖中央区域,从而占据了一定的份额,从而占据了一定的份额。据我所知,尚未在中石器时代的住宅上发表过关于此规模的定量研究。目的是通过检测和评估这些住宅的年代和区域分布中的模式来识别文化和人口转变,以阐明在5500年的使用中石器时代的定居动力学和生活方式的变化,并增加我们对欧洲欧洲近质石质定居点的理解。在北部芬诺斯坎迪亚(Northern Fennoscandia),对史前住宅遗体的大规模研究和分析(“家庭坑”)在长期定居史的建设和评估中发挥了重要作用。然而,重点是新石器时代和后期的时期,因为这些区域的大部分已知“房屋”邮政日期为4000 Cal BC(请参阅Engelstad,1988; Lundberg,1997; Olsen,1997; Olsen,1997; Norberg,2008; Norberg,2008;Mökkönen,2011; Damm et,2022;,2022年)。北欧(9500 - 4000 cal BC)的中石器时代被广泛认为是重大文化和社会变革的时期,涉及移民和先驱定居点,在更加狭窄的地理区域中使用更广泛的资源光谱,
1. 当学生按照与执行步骤相同的顺序学习时,他们学习程序和过程的效果最好 (Feldon, 2010)。 2. 当学生通过参与活动学习新材料时,他们比被动地观看或听老师讲课时学习效果更好,记忆时间更长 (Bligh, 2000; Bonwell & Eison, 1991; Deslauriers, Schelew, & Wieman, 2011; Hake, 1998; Jones-Wilson, 2005; Spence, 2001; Svinicki, 2004; Swiderski, 2005)。因为与他人互动需要积极参与,所以我们添加了 Persellin 和 Daniels (2014) 的这一推论,尽管它源自课堂教学和学习文献而非认知心理学:小组工作和讨论让学生参与进来,让他们能够积极地自行构建知识 (Stage、Kinzie、Muller 和 Simmons,1999)。3. 学生从实践中学习,但只有当他们收到有针对性的反馈时,他们才能利用这些反馈来提高自己在进一步实践中的表现 (Ambrose、Bridges、DiPietro、Lovett 和 Norman,2010)。当然,他们必须首先阅读并准确解释这些反馈,但他们并不总是这样做 (Falkenberg,1996)。 4. 学生将新知识与先前的知识联系起来,这凸显了先前知识的有效性和组织性的重要性(Ambrose 等人,2010;Baume 和 Baume,2008;Bransford、Brown 和 Cocking,1999;Taylor 和 Kowalski,2014)。 5. 当学生感觉自己处于安全、低压力、支持性、受欢迎的环境中时,他们会学得最好、最轻松(Ambrose 等人,2010;Doyle 和 Zakrajsek,2013)。他们更有可能实现课程的学习成果,发展高阶思维技能,参与课堂活动,在课堂上表现得体,有学习动机,对课程感到满意,无论是在课堂上(Cornelius-White,2007;Granitz、Koernig 和 Harich,2009)还是在线(Lundberg 和 Sheridan,2015)。 6. 某些特质能够吸引并保持学生的注意力和专注力,从而帮助学生更好地学习新材料并记住更长时间:人脸、颜色、强度、极端对比、运动、变化、戏剧性、教师热情和个人相关性(Ambrose 等人,2010 年;Bransford 等人,1999 年;Hobson,2002 年;Persellin 和 Daniels,2014 年;Svinicki,2004 年;Winne 和 Nesbit,2010 年)。 7. 学生通过精细复述学习和存储新材料(即将其从工作记忆转移到长期记忆中),这意味着思考新材料的意义和重要性,并将其与他们先前的知识、信念和心理模型联系起来(Ambrose 等人,2010 年;Bransford 等人,1999 年;Tigner,1999 年;Zull,2002 年)。 8. 当教学设计为最小化认知负荷时,学生最容易学习新材料(Feldon,2010;Sweller,van Merriënboer和Paas,1998;Wickens,2002,2008;Winne和Nesbit,2010)。通过认知负荷,我们指的是对工作记忆的要求。大脑在工作记忆中保存信息的能力是有限的,因此打包信息以尽可能高效地处理信息非常重要。这一原则非常笼统,但有一些子原则可以阐明其含义(见下一节)。
本研究考察了 2000 年至 2023 年期间气候相关金融政策 (CRFP) 在促进 87 个国家脱碳和可再生能源生产 (REP) 方面的影响。通过采用先进的机器学习方法,并使用政策排序评分 (PSS) 和约束力加权采用指标,该分析为政策设计、经济背景和环境结果之间的复杂关系提供了宝贵的见解。研究结果强调了全球和地区之间的重大差异,为使金融体系与气候目标保持一致提供了可操作的指导。气候相关金融政策对于通过管理气候相关风险和将资本流转向可持续投资来使金融部门与环境目标保持一致至关重要 (D'Orazio & Thole, 2022)。这些政策对于实现《巴黎协定》第 2.1(c) 条至关重要,该条强调将资金流与支持低温室气体 (GHG) 排放和气候适应型发展的途径相结合。绿色债券、强制披露和气候风险评估等工具使金融当局能够减轻系统性风险并促进绿色投资(OECD,2024 年)。例如,绿色债券为可再生能源和能源效率项目提供了大量资金,尤其是在东南亚,尽管将收益分配给海外项目限制了其对当地的影响。同样,强制性的气候风险披露也改变了投资模式,对碳密集型行业征收了“碳风险溢价”。在此背景下,绿色金融原则、披露要求和审慎监管的作用不容小觑。欧洲和亚洲部分地区的金融当局已经引入了强制性披露制度,以解决市场效率低下问题并激励绿色技术创新。这些措施直接影响了碳密集型行业的信誉,将资本流向低碳替代品。该研究采用机器学习技术,包括 Shapley 加法解释 (SHAP),来评估 CRFP 对二氧化碳排放和 REP 等关键环境指标的影响(Lundberg,2017 年)。政策排序评分 (PSS) 量化一个国家与全球最佳实践的政策一致性,而累积政策指数 × 约束力 (CumBind) 则评估政策实施的可执行性和强度。这些指标使我们可以对不同国家组和经济背景进行细致入微的分析。利用这些方法,该研究克服了传统计量经济学的局限性,从而可以更动态地理解因果关系和政策协同作用(Mullainathan, S. & Spiess, 2017)。研究结果表明,发达经济体受益于结构化政策和强有力的机构,这些政策和机构持续推动减少排放和增加可再生能源生产。对于 G20 和 OECD 国家而言,这种影响在具有强大执行机制的经济体中尤为明显,这些经济体的强制披露和绿色金融原则等政策已导致投资模式发生可衡量的变化。然而,在政策采用的更高水平上观察到收益递减,这凸显了持续创新以维持进步的必要性。另一方面,新兴市场和发展中经济体 (EMDE) 面临着限制政策有效性的制度和结构性制约因素。尽管存在这些挑战,EMDE 中的有针对性的 CRFP 仍显示出巨大的潜力,特别是在撒哈拉以南非洲和南亚,这些地区的可再生能源增长引人注目。图 1 全面分析了 CRFP 对 CO2 排放和 REP 的区域影响。面板 A 和 B 中拟合的 SHAP 值说明了政策排序分数 (PSS) 的区域特定趋势。面板 A 显示,随着 PSS 的增加,东亚和太平洋地区的 CO2 排放 SHAP 值急剧下降,表明排序与减排之间存在很强的关系。相反,拉丁美洲和加勒比地区的 SHAP 值急剧上升,反映出有效排序的困难。面板 B 显示,撒哈拉以南非洲地区的 PSS 和 REP 之间存在非线性正相关关系,突显出对改进排序的显著响应,而东亚和太平洋地区则呈现出较为平缓的趋势,表明由于已经很先进的可再生能源部门,边际收益正在递减。面板 C 和 D 研究了约束力加权政策 (CumBind) 的影响。面板 C 发现,在南亚、拉丁美洲和加勒比地区等地区,CumBind 与 CO2 排放之间存在正相关关系,表明存在实施差距或对碳密集型产业的依赖。相比之下,欧洲和中亚呈现下降趋势,反映出更成熟的政策格局。小组 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚地区可再生能源发电增长方面发挥的关键作用,强调了它们在扩大可再生能源产能方面的重要性。尽管存在这些挑战,EMDE 中的有针对性的 CRFP 仍显示出巨大的潜力,特别是在可再生能源增长显著的撒哈拉以南非洲和南亚。图 1 全面分析了 CRFP 对 CO2 排放和 REP 的区域影响。面板 A 和 B 中拟合的 SHAP 值说明了政策排序评分 (PSS) 的区域特定趋势。面板 A 显示,随着 PSS 的增加,东亚和太平洋地区的 CO2 排放 SHAP 值急剧下降,表明排序与减排之间存在很强的关系。相反,拉丁美洲和加勒比地区的 SHAP 值急剧上升,反映出有效排序的困难。面板 B 显示,撒哈拉以南非洲的 PSS 和 REP 之间存在非线性正相关关系,突显出对改进排序的显著响应,而东亚和太平洋地区则呈现出较平缓的趋势,表明由于已经很先进的可再生能源部门,边际收益正在递减。面板 C 和 D 研究了约束加权政策 (CumBind) 的影响。面板 C 表明,在南亚、拉丁美洲和加勒比地区等地区,CumBind 与二氧化碳排放量之间存在正相关关系,表明存在实施差距或对碳密集型行业的依赖。相比之下,欧洲和中亚呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚 REP 增长方面的关键作用,强调了它们在扩大可再生能源容量方面的重要性。尽管存在这些挑战,EMDE 中的有针对性的 CRFP 仍显示出巨大的潜力,特别是在可再生能源增长显著的撒哈拉以南非洲和南亚。图 1 全面分析了 CRFP 对 CO2 排放和 REP 的区域影响。面板 A 和 B 中拟合的 SHAP 值说明了政策排序评分 (PSS) 的区域特定趋势。面板 A 显示,随着 PSS 的增加,东亚和太平洋地区的 CO2 排放 SHAP 值急剧下降,表明排序与减排之间存在很强的关系。相反,拉丁美洲和加勒比地区的 SHAP 值急剧上升,反映出有效排序的困难。面板 B 显示,撒哈拉以南非洲的 PSS 和 REP 之间存在非线性正相关关系,突显出对改进排序的显著响应,而东亚和太平洋地区则呈现出较平缓的趋势,表明由于已经很先进的可再生能源部门,边际收益正在递减。面板 C 和 D 研究了约束加权政策 (CumBind) 的影响。面板 C 表明,在南亚、拉丁美洲和加勒比地区等地区,CumBind 与二氧化碳排放量之间存在正相关关系,表明存在实施差距或对碳密集型行业的依赖。相比之下,欧洲和中亚呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚 REP 增长方面的关键作用,强调了它们在扩大可再生能源容量方面的重要性。这表明存在执行差距或依赖碳密集型行业。相比之下,欧洲和中亚地区则呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚地区可再生能源发电增长方面的关键作用,强调了它们在扩大可再生能源产能方面的重要性。这表明存在执行差距或依赖碳密集型行业。相比之下,欧洲和中亚地区则呈现下降趋势,反映出更成熟的政策格局。面板 D 强调了约束性政策在推动撒哈拉以南非洲、拉丁美洲、加勒比地区、欧洲和中亚地区可再生能源发电增长方面的关键作用,强调了它们在扩大可再生能源产能方面的重要性。
精确医学的主要重点是使用计算工具来准确预测疾病结果并确定相关的生物标志物以进行有效的后续评估。Over the last two decades, linear models have been widely implemented to identify differentially expressed genes and enriched signaling pathways in functional genomics (Love et al., 2014 ; Nueda et al., 2014 ; Ritchie et al., 2015 ; Robinson et al., 2009 ), characterize complex trait architecture in genome-wide association studies (, 2010 ; Hayeck et al., 2015 ; Heckerman et al., 2019年,Kang et al。等Al。,2018年; Manno等,2018),并在不同的时间点,数据收集位点和组织类型上进行有效的归一化和维度降低(Hasin等,2017;Lähnemann等,2020)。这些方法的一部分是它们提供统计显着性措施的能力,例如P值,后置包含概率(PIPS)或然后可以使用的贝叶斯因素,可用于促进下游任务(例如,选择哪些分子机制以药物为目标或选择哪些临床干预措施对特定患者有效)。不幸的是,严格的加性假设通常会阻碍线性模型的性能;这些方法中最强大的方法依赖于训练算法,这些算法在计算上效率低下且对大规模数据集不可靠。成像和测序技术的持续进步(Stephens等,2015)提供了范围,以将多模式的非参数方法整合为生物学和临床应用中的最先进工具。的确,机器学习方法众所周知,具有在数据中学习复杂的非线性模式的能力,并且当有大量的培训示例可用时,它们通常在设置中获得最大的功能(Lecun等,2015)。然而,文献中已被大量引用,许多机器学习技术都受到“黑匣子”限制的影响,因为它们并不自然地进行经典的统计假设测试,例如线性模型,这对于精确医学中的决策至关重要。导致非线性算法更好的预测性能的关键特征之一是自动包含被放入模型中的特征之间的高阶相互作用(Crawford等,2018; Jiang&Reif,2015)。例如,神经网络利用分层之间的激活功能,这些层隐式列举了输入特征之间所有可能的(多项式)交互作用(Demetci等,2021; 2021; Murdoch等,2019; Tsang,Cheng,Cheng,&Liu,&Liu,2018; Tsang,Liu,Liu等,2018; 2018; WAHBA,1900年)。这已被证明在准确预测模型生物的特征方面有所作为,在这些特征中,诸如epistasis之类的现象(即多个基因座和/或基因之间的相互作用)可以在物种之间的变化中发挥很大作用(Bellot等人,2018; Runcie et al。,2021; Swain等,2016; swain等,2016; 2016; weissbrod et al an a w weissbrod et al。这是用于改进模型的部分数学解释,但在许多生物医学应用中,我们经常希望准确地知道哪些基因组特征(例如变体,基因和途径)对于定义表型或疾病结果的结构最重要。本手稿的主要目的是回顾大量的方法论研究,这些方法是为了开发计算生物学中更“可解释的”和“可解释”的机器学习。在整个本文中,我们将使用经典的观点,即“解释性”与使用模型参数的事后能力有关(有时也称为在文献的某些领域中表现“可变重要性”)(Crawford et al。,2019; Lundberg&Lundberg&Lee,2016,2017,2017; ribeio; ribeio et alik anik shrik,shrik shrik;虽然“解释性”是模型固有地为其参数和体系结构提供了可理解的定义(Hira等,2019; Marcinkevics&Vogt,2020; Shmueli,2010)。两个概念都可以分为试图在(i)全球范围上实现解释性或可解释性的方法类别,在该方法中,目标是对观察到的人群的整体变化的贡献进行对/(ii)在局部层面上的贡献进行排名/选择的输入,旨在详细介绍对数据集中的任何特定个人的重要性。在这里,我们将专注于描述神经网络中的全球尺度方法,其特殊动机来自基于关联映射的基因组学应用程序。我们在这篇综述中的主要贡献是为我们所说的“透明度谱”提供全面的景观,用于监督和无监督的学习算法,因为我们从黑匣子转移到可解释的方法,并最终转化为可解释的方法(图1)。