摘要这项研究研究了六种著名的大型语言模型的道德推理:OpenAI的GPT-4O,Meta的Llama 3.1,困惑,人类的Claude 3.5十四行诗,Google的Gemini和Mismtral 7b。该研究探讨了这些模型如何表达和应用道德逻辑,特别是在响应道德困境(例如手推车问题)和亨氏困境中。偏离了传统的一致性研究,该研究采用了解释性透明框架,促使模型解释了他们的道德推理。通过三种既定的伦理类型学分析了这种方法:结果主义 - 道德分析,道德基础理论和科尔伯格的道德发展阶段。的发现表明,LLM在很大程度上表现出了很大程度上收敛的伦理逻辑,其标志是理性主义者,后果主义者的重点,而决策通常优先考虑危害最小化和公平性。尽管在训练前和模型结构上相似,但跨模型中伦理推理的细微差异和显着差异的混合物反映了微调和训练后过程的差异。模型始终显示出博学,谨慎和自我意识,表现出类似于道德哲学中的研究生级话语的道德推理。在惊人的统一性中,这些系统都将其道德推理描述为比典型的人类道德逻辑的特征更复杂。鉴于人类对此类问题的争论的悠久历史,仍然存在“与谁的价值观保持一致的问题(Brown 1991; Taylor 2023; Klingeford et al。2024)。1987; Sawyer&Jarrahi 2014)。1987; Sawyer&Jarrahi 2014)。生成大语言模型的快速发展使对齐问题成为AI伦理讨论的最前沿 - 具体来说,这些模型是否与人类价值观适当地保持一致(Bostrom,2014; Tegmark 2017; Russell 2017; Russell 2019)。,但我们可能会认为,提出一致性问题的人主要是在适当地呼吁人们注意最大程度地减少对人类生活和环境的身体伤害的更广泛的问题,并最大程度地提高人类在这个不断发展的社会技术领域中寻求目标的能力(Bijker等人,当然,极端的未对准的情况是戏剧性的反对,因为超级智能人工智能模型可能决定控制所有人类系统,消除人类并使世界对人工实体而不是人类的安全。许多认真的分析师深入探讨了这些存在的风险情景(Good 1965; Bostrom 2014;
AMA 伦理学杂志® 2021 年 8 月,第 23 卷,第 8 期:E599-600 编辑寄语 医疗保健经济模型中的伦理问题 Elina E. Pliakos 据估计,美国每年约有 25% 的医疗保健支出是不必要的和浪费的。1 这相当于每年可节省约 7600 亿至 9350 亿美元,如果节省下来,可以帮助抑制美国医疗保健支出的增加。1 已经提出了各种减少不必要开支的策略,例如注重预防性护理、消除不必要的检查和程序以及控制处方药成本。2 医疗保健系统的波动性以及重要资源在危机中容易耗尽,因此必须找到可靠的方法来分配有限的医疗保健资源,以最大限度地提高整体人口健康效益,同时最大限度地降低风险和危害。关于投资哪些干预措施的资源分配决策充满了复杂性和不确定性。因此,决策分析模型通常用于综合来自多种来源的证据,并帮助为在处理这种复杂性时必须做出的决策提供信息。3 经济决策模型旨在量化与干预措施相关的临床和经济效益和危害,以帮助政策制定者和组织领导者预测预期成本并管理可能的权衡。1977 年,Weinstein 和 Stason 建议,应根据成本相对于预期效益的指数来做出资源分配决策并确定优先事项。4 尽管自 1977 年以来,计算能力有所提高,医学的进步 5 也促成了有关如何进行卫生经济分析的指南的制定,6,7 但很少关注在医疗保健中使用经济决策模型和分析的伦理和社会层面。本期专题旨在填补这一空白,并探讨经济模型如何激发良好的决策,以改善卫生系统绩效、临床实践和患者的医疗保健体验。标准护理、循证护理和基于价值的护理之间的差异使得在设计和实施模型以及解释这些模型生成的结果时很难决定要遵循哪些经济决策建模指导。例如,模型结构、数据来源和假设会影响临床医生和组织领导者可以从中学到的东西的有效性,因此具有伦理、社会和文化相关性。本期主题详细探讨了这组主题,并考虑了建模的透明度如何有助于促进公平、成本效益、良好的资源管理和价值。我希望本期主题能够阐明经济建模和医疗保健交叉领域的关键概念
为此取得成功的是优化库的可用性,例如Abinit [8],Quantum Espresso [9],VASP [10],Berkleygw [11],Yambo [12],Triqs [13]和更多[14],并利用了一遍又一遍地开发复杂的代码。如果没有这样的公共代码,每个研究人员都必须自己实施该方法,从而与最有可能的次级最佳结果创造了许多冗余工作。因此,方法的广泛适用性是拥有可用的公共代码的广泛适用性,以及有关实施中最佳实践的有记录的知识。在相关材料的研究中,上面提到的基于AB-Initio的治疗方法包含许多重要特征。但是,来自电子相互作用的超导顺序以及在多体schrödinger方程的近似So中产生的远程相互作用的其他效果仅包括部分或根本不包括。这创造了对我们可以连接到这些开发的方法和代码的需求,并通过添加缺失的作品来表达现状。在计算凝结物理学中,从有效的低能描述开始,仅保留少数相关的频带,它已被证明有效。如何到达这样的折叠模型的过程构成了第一个障碍。随后,我们仍然必须求解一个模型,其中包括一些频段,并具有相互作用的相互作用。要解决此类问题,我们通常需要引入近似值,这应该得到很好的控制。库基于通用模型接口(参见对于一类宽类材料,我们可以使用缠扰性方法,例如随机相位近似(RPA),Parquet近似[15]和FRG [16,17]。前者仅包含特定的图形通道,而二线却是图形的,因此是扩展Ab-Initio机械的主要候选者;问题是,整个方程式,结合其所有依赖项的实施超出了我们目前的影响力。在本文中,我们提出了分歧1 - 开源,高性能(多节点CPU&Multi-gpu)C / C ++ / Python库(在[18]上可用),该库实现了FRG的不同口味[16,17]。第3节)和三个不同的计算后端:(i)网格frg [19,20],(ii)截断的unity frg(tu 2 frg)[21 - 23]和(iii)轨道空间n-patch frg [24 - 26]。每个中央方程都执行不同的近似值,从而产生不同的数值复杂性,如附录d所述。本文被设计为动手介绍分歧的使用。因此,我们将FRG简要概括为第2节中的数值方法,介绍了第3节中的模型结构,解释了如何在第4节中求解流程方程以及如何在第5节中分析结果。
TuT1(教程)- 可靠性物理与工程简介,Joe McPherson,McPherson Reliability Consulting LLC 所有材料和设备都会随着时间的推移而退化。因此,可靠性物理具有重要的理论和实践意义。可靠性调查通常从测量材料/设备在应力下的退化率开始,然后对失效时间与施加应力的关系进行建模。这里使用的术语“应力”非常笼统:应力指任何外部因素(电气、机械、化学、热、电化学等)能够产生材料/设备退化的因素。当退化量达到某个临界阈值水平时,就会发生失效时间。由于设备通常需要不同程度的退化才能引发故障,因此故障时间本质上是统计性的,并讨论了两种常见的故障分布:威布尔和对数正态分布。故障时间 (TF) 建模通常假设幂律或指数应力依赖性,具有 Arrhenius 或 Eyring 类活化能。从这些 TF 模型中,可以推导出加速因子,这些因子往往作为加速测试的基础。在本演讲中,将回顾几种半导体故障机制:电迁移 (EM)、应力迁移 (SM)、时间相关电介质击穿 (TDDB)、热载流子注入 (HCI)、负偏置温度不稳定性 (NBTI)、等离子体诱导损伤 (PID)、单粒子翻转 (SEU)、表面反转、热循环疲劳和腐蚀。本教程应为参会者提供坚实的基础,以便更好地理解 IRPS 上发表的论文。TuT2(教程) - 集成电路和半导体器件可靠性分析的机器学习,伊利诺伊大学厄巴纳-香槟分校 Elyse Rosenbaum 本教程适用于对机器学习(“ML”)如何在其学科中应用感兴趣的可靠性物理专家。它将使用机器学习的广泛定义,将 ML 等同于数据驱动建模,并将其与基于物理知识(即机械模型)的模型和预测进行对比。神经网络是一种流行的数据驱动建模模型结构,因为它具有灵活性;它通常被称为通用近似器。本教程将介绍神经网络训练的基础知识。本文将介绍将 ML 应用于可靠性分析各个方面的研究成果。TuT3(教程)- BEOL 和 MOL 可靠性,Shinji Yokogawa,电气通信大学 BEOL 可靠性在半导体技术中发挥着至关重要的作用,从开发到质量保证。典型的磨损机制包括电迁移 (EM)、应力迁移/应力诱导空洞 (SM/SIV)、热机械稳定性、低介电击穿 (TDDB) 和芯片/封装相互作用 (CPI)。最近,围绕栅极/接触或 MOL 可靠性的可靠性问题已被添加到列表中。由金属和电介质界面中的缺陷及其产生引起的互连、通孔和接触可靠性挑战被认为是重要问题,即使代数、结构和材料发生变化。了解它们以及如何抑制它们是实现高可靠性的关键。了解每个集成电路的寿命分布行为对于确定由许多部分组成的集成电路的可靠性也至关重要。本教程将介绍物理和统计
TuT1(教程)- 可靠性物理与工程简介,Joe McPherson,McPherson Reliability Consulting LLC 所有材料和设备都会随着时间的推移而退化。因此,可靠性物理具有重要的理论和实践意义。可靠性调查通常从测量材料/设备在应力下的退化率开始,然后对失效时间与施加应力的关系进行建模。这里使用的术语“应力”非常笼统:应力指任何外部因素(电气、机械、化学、热、电化学等)能够产生材料/设备退化的因素。当退化量达到某个临界阈值水平时,就会发生失效时间。由于设备通常需要不同程度的退化才能引发故障,因此故障时间本质上是统计性的,并讨论了两种常见的故障分布:威布尔和对数正态分布。故障时间 (TF) 建模通常假设幂律或指数应力依赖性,具有 Arrhenius 或 Eyring 类活化能。从这些 TF 模型中,可以推导出加速因子,这些因子往往作为加速测试的基础。在本演讲中,将回顾几种半导体故障机制:电迁移 (EM)、应力迁移 (SM)、时间相关电介质击穿 (TDDB)、热载流子注入 (HCI)、负偏置温度不稳定性 (NBTI)、等离子体诱导损伤 (PID)、单粒子翻转 (SEU)、表面反转、热循环疲劳和腐蚀。本教程应为参会者提供坚实的基础,以便更好地理解 IRPS 上发表的论文。TuT2(教程) - 集成电路和半导体器件可靠性分析的机器学习,伊利诺伊大学厄巴纳-香槟分校 Elyse Rosenbaum 本教程适用于对机器学习(“ML”)如何在其学科中应用感兴趣的可靠性物理专家。它将使用机器学习的广泛定义,将 ML 等同于数据驱动建模,并将其与基于物理知识(即机械模型)的模型和预测进行对比。神经网络是一种流行的数据驱动建模模型结构,因为它具有灵活性;它通常被称为通用近似器。本教程将介绍神经网络训练的基础知识。本文将介绍将 ML 应用于可靠性分析各个方面的研究成果。TuT3(教程)- BEOL 和 MOL 可靠性,Shinji Yokogawa,电气通信大学 BEOL 可靠性在半导体技术中发挥着至关重要的作用,从开发到质量保证。典型的磨损机制包括电迁移 (EM)、应力迁移/应力诱导空洞 (SM/SIV)、热机械稳定性、低介电击穿 (TDDB) 和芯片/封装相互作用 (CPI)。最近,围绕栅极/接触或 MOL 可靠性的可靠性问题已被添加到列表中。由金属和电介质界面中的缺陷及其产生引起的互连、通孔和接触可靠性挑战被认为是重要问题,即使代数、结构和材料发生变化。了解它们以及如何抑制它们是实现高可靠性的关键。了解每个集成电路的寿命分布行为对于确定由许多部分组成的集成电路的可靠性也至关重要。本教程将介绍物理和统计
Piso.AI 使用机器学习框架,使用可用且定期更新的网格气候数据产品和位置变量来预测/重建过去特定月份和年份降水的氢和氧同位素组成。该模型使用全球降水同位素网络 (GNIP) 提供的降水同位素数据进行训练。该方法的详细信息在原始出版物中概述。如果您将 Piso.AI 用于您的工作(出版物、口头/海报演示等),我们要求您引用:Nelson, D.B., Basler, D., Kahmen, A.(2021)。“机器学习在欧洲应用的降水同位素时间序列预测。”美国国家科学院院刊,第 12 卷。118 号26 e2024107118。Piso.AI 旨在定期更新,因为所使用的输入气候数据每年都会更新。年度更新不会改变输入变量的选择或用于重建氧和氢同位素值的模型结构。如果输入气候变量发生变化(例如,由于原始数据提供者使用的插值方案更新),则对过去时间点的预测将仅在每年更新与下一次更新之间有所不同。Piso.AI 的年度更新以版本号后的更新年份表示。原始出版物使用了截至 2019 年底的数据,称为 Piso.AI v.1.01。第一个包含对新一年 2020 年预测的更新名为 Piso.AI v.1.2020。未来可能实施的模型结构的任何更改(例如纳入新的预测变量或使用新输入数据重新训练模型)都将以新版本号 (即 Piso.AI v.X) 标记。早于原始出版物的 Piso.AI 版本现在追溯重命名为 Piso.AI v.0.9(之前在 2020 年 9 月之前在 Piso.AI 网站上提供)和 Piso.AI v.0.01(之前在 2021 年 3 月之前在 Piso.AI 网站上提供)。还可能引入使用 Piso.AI 框架的其他模型,但这些模型将使用新名称标识。第一个这样的扩展是 Piso.AI.eur1900。该模型使用与原始 Piso.AI 类似的空间域,但使用更有限的预测变量选择,允许重建更早的沉淀氧和氢同位素值。但准确性会略有降低,Piso.AI.eur1900 v.1.2020 目前涵盖的是 1901 年至 2020 年的时间段。有关此应用程序的更多信息,请参阅:https://isotope.bot.unibas.ch/PisoAI-eur1900-v1-2020/ 模型版本和数据更新:Piso.AI v.1.2020(2021 年 12 月发布)预测变量:- 气候研究单位 (CRU) 时间序列数据 v.4.05 - 欧洲观测网格数据集 (E-OBS) v.23.1e - 国家环境预测中心 (NCEP/NCAR) 再分析 1 项目数据(包括 2020 年)- 从气候预测中心获得的遥相关指数时间序列数据(包括 2020 年)Piso.AI v.1.01(原始出版物中的版本)预测变量:- 气候研究单位 (CRU) 时间序列数据 v.4.04
卫生经济模型通常用于世界许多国家医疗资源分配决策[1-5]。模型提供了一种明确的方法来构建决策问题并综合所有相关证据来估计给定健康状况(通常为终生健康状况)下替代医疗干预措施的预期成本和后果。传统的卫生经济模型是“分段的”,因为它们通常解决护理路径中特定决策点的单个决策问题。分段模型代表了英国国家健康与临床优化研究所 (NICE) 和其他类似机构用于指导有关卫生技术可用性的决策的标准分析方法[6-8],但它们受到一些局限性[9]。其中第一个局限性与未能捕捉不同干预措施之间的系统相互依赖性有关。任何新干预措施的成本效益不仅取决于新干预措施本身的成本和有效性,还取决于现行系统的配置,即现有干预措施的可用性、成本和有效性[9,10]。例如,针对某种癌症类型的新检测的成本效益可能取决于目前对确诊疾病患者的推荐治疗方案,以及对无症状个体的筛查计划的可用性。由于分段模型的范围有限,这种用于同一病症的干预措施之间的系统级相互依赖性很少能被充分捕捉。其次,分段模型通常采用简单的分段成本/质量调整生命年 (QALY) 阈值规则,该规则不明确考虑预算约束 [11,12]。然而,有充分的证据表明,反复应用基于阈值的决策规则可能会导致医疗保健支出不受控制地增长 [13-18]。第三,大多数模型的开发目的都是为了为更广泛医疗途径中的单个决策问题提供信息。这意味着,在整个疾病领域,报销和覆盖范围决策基于许多异步开发的离散经济模型,这些模型往往应用不同的模型结构、假设和证据。这可能导致两个解决同一决策问题的模型得出不一致的结论,有可能导致次优的采用决策[19-25]。系统级模型涵盖整个疾病领域的重要事件、健康结果和成本,是解决传统分段模型局限性的潜在方法。三个著名的系统级模型包括美国阿基米德糖尿病模型[26]、美国冠心病 (CHD) 政策模型[27]和英国 CHD 模型[28]。虽然这种建模方法可以追溯到 1977 年 [ 29 ],但直到 2012 年 Tappenden 等人提出了全疾病模型 (WDM) 的方法框架 [ 9 ],它才得到很好的定义。简而言之,WDM 是一个系统级的通用疾病模型,可以对整个疾病和治疗途径(包括预防、检测、诊断和治疗)中的选项进行一致的经济分析 [ 9 ]。由于这些模型的范围更广,它们侧重于整个疾病和治疗途径,而不是
健康经济模型通常用于为全球许多国家的医疗保健资源分配决策提供信息[1-5]。模型提供了构建决策问题并综合所有相关证据的明确手段,以估算给定健康状况(通常在一生中)内的替代卫生保健干预措施的预期成本和后果。常规健康经济模型是“分段”,因为它们典型地在护理途径的特定决策点上解决了一个决策问题。“零件”模型代表了国家卫生与护理研究所(NICE)和其他地方的类似机构提供有关健康技术可用性的决策的标准分析方法[6-8],但它们受到了一些局限性[9]。其中的第一个涉及不同干预措施之间的系统相互依存关系。任何新干预措施的成本效益不仅取决于新干预本身的成本和有效性,还取决于预批次系统的配置,即现有干预措施的可用性,成本和有效性[9,10]。例如,针对给定癌症类型的新测试的成本效益可能取决于针对诊断疾病的患者的适当建议的治疗选择,以及无症状患者筛查计划的可用性。这种类型的系统级相互依赖性在用于同一条件的干预措施之间,由于其有限的范围,很少会被分段模型充分限制。第二,分段模型通常采用每个质量调整的生命年(QALY)阈值规则的简单分段成本,该规则不明确考虑预算限制[11,12]。但是,已经有充分的文献证明,基于阈值的决策规则的重复应用可能导致医疗保健支出的不受控制[13-18]。第三,大多数模型都是为了在更广泛的护理途径中告知单个决策问题。这意味着在整个疾病领域,报销和覆盖范围决策基于许多倾向于采用不同模型结构,假设和证据的Asyn-Gronen-Grone-Gronaper of Spections Intronaper开发的经济模型。这可能导致这样一种情况,即两个解决同一决策问题的模型会产生不一致的结论,并有可能导致最佳采用决策[19-25]。系统级模型包括重要事件,整个疾病领域的健康成果和成本,代表了解决常规分段模型局限性的潜在手段。系统级模型的三个众所周知的例子包括美国档案糖尿病模型[26],美国冠心病(CHD)政策模型[27]和英国CHD模型[28]。尽管这种建模方法可以追溯到1977年[29],但直到2012年Tappenden等到2012年。为全疾病模型(WDM)设置了方法学框架[9]。由于这些模型的更广泛范围,该模型的重点是整个疾病和治疗途径简而言之,WDM是一种系统级通用疾病模型,可以对整个疾病和治疗途径的期权进行一致的经济分析,包括预防,检测,诊断和治疗[9]。