在浮动式海上风电 (FOW) 系泊系统中,组件或系统故障可能造成各种后果,从性能的相对微小变化一直到完全失去定位并损坏阵列内的其他装置。收入损失、中断和恢复和维修费用可能会损害众多利益相关者(开发商、制造商、运营商和最终用户)的业务和声誉。商业 FOW 农场中相邻平台与其他水上用户之间的潜在相互作用意味着系泊故障的风险及其影响必须最终在农场层面进行评估,例如,意外极限状态 (ALS) 下平台分离的要求。还存在超出可服务极限状态 (SLS) 的可能性,这会影响发电,而无需系泊系统完全故障。
系统性风险 … 整体系统可靠性 1. 频率响应义务 (FRO) 是否满足? 2. 不稳定性?例如振荡、负载削减、相互作用 3. 弹性?例如易受单点故障影响 位置性风险 … 位置限制? 1. 区域间稳定?例如区域限制、振荡、UFLS 2. 设备间稳定?例如控制相互作用 3. 局部弹性?例如局部故障点
摘要 — 图形处理单元 (GPU) 越来越多地被应用于可靠性至关重要的多个领域,例如自动驾驶汽车和自主系统。不幸的是,GPU 设备已被证明具有很高的错误率,而实时安全关键应用程序所施加的限制使得传统的(且昂贵的)基于复制的强化解决方案不足。这项工作提出了一种有效的方法来识别 GPU 模块中的架构易受攻击的位置,即如果损坏则最影响正确指令执行的位置。我们首先通过基于寄存器传输级 (RTL) 故障注入实验的创新方法来识别 GPU 模型的架构漏洞。然后,我们通过对已确定为关键的触发器应用选择性强化来减轻故障影响。我们评估了三种强化策略:三重模块冗余 (TMR)、针对 SET 的三重模块冗余 (∆ TMR) 和双联锁存储单元(骰子触发器)。在考虑功能单元、流水线寄存器和 Warp 调度器控制器的公开 GPU 模型 (FlexGripPlus) 上收集的结果表明,我们的方法可以容忍流水线寄存器中 85% 到 99% 的故障、功能单元中 50% 到 100% 的故障以及 Warp 调度器中高达 10% 的故障,同时降低硬件开销(与传统 TMR 相比,在 58% 到 94% 的范围内)。最后,我们调整了该方法以针对永久性故障执行补充评估,并确定了容易在 GPU 上传播故障影响的关键位置。我们发现,对瞬态故障至关重要的触发器中相当一部分(65% 到 98%)对永久性故障也至关重要。
图形处理单元 (GPU) 承受着过大的压力,以加速高性能计算应用程序,并用于加速多个领域的深度神经网络,这些领域的预期寿命长达数年。这些条件使 GPU 硬件面临(过早)老化,导致在通常的制造结束测试之后出现永久性故障。因此,迫切需要评估 GPU 永久性故障影响的技术,从而可以估计可靠性风险并可能减轻它。在本文中,我们提出了一种评估永久性故障对 GPU 调度器和控制单元(最特殊、压力最大的资源)的影响的方法,以及可以量化这些影响的第一个数字。我们描述了门级 GPU 模型的调度器和控制器中超过 5.83x10 5 个永久性故障效应。然后,我们通过检测 13 个应用程序和两个卷积神经网络的代码,在软件中映射观察到的错误类别,注入超过 1.65x105
摘要 - 执行器故障可能会危害控制系统的性能和闭环稳定性。执行器与适当控制定律结合使用可以提高系统对效率丧失或障碍的弹性。被动故障控制(FTC)系统旨在设计独特的控制定律,并在名义和故障场景中保证稳定性。在这项工作中,一种新型基于机器学习的方法是为由执行器故障影响的系统系统合成控制法的,同时正式认证闭环稳定性的。学习体系结构训练两个人工神经网络,一个代表控制定律,另一个类似于控制Lyapunov功能(CLF)。同时,使用满意度模型理论求解器来证明所获得的CLF正式保证Lyapunov条件。该方法用于两种情况,一种涵盖了具有冗余执行器的倒摆的稳定,而另一种则涵盖了自主水下车辆的控制。该框架显示能够通过最小的高参数调整以及有限的计算资源来合成线性和非线性控制定律。
未来电动飞机和混合动力飞机对电力的需求不断增加,机载系统的高功率电力转换研究工作一直在进行中。航空系统的安全关键性质使航空电力转换器的可靠性成为关键的设计考虑因素。本文研究了电力电子系统的可靠性,重点研究了关键子部件的寿命限制因素。为起动发电机驱动转换器建模了不同系统电压水平下的电压源功率转换器的可靠性。一个关键的观察结果是,Si IGBT 器件足以满足低压和中压系统(高达 540 V)的可靠性要求。在更高的系统电压(高于 540 V)下,使用 Si IGBT 进行设计需要多级拓扑。在恒定功率曲线驱动中,转换器直流链路中薄膜电容器的磨损故障对系统可靠性的影响最小。在没有增强电压降额的多级拓扑中,系统可靠性主要受宇宙射线引起的随机故障影响。仿真结果表明,在高系统电压 (810 V) 下,带有 SiC mosfet 的 2 L 拓扑在可靠性方面优于基于 Si IGBT 的 3 L 拓扑。
7用于所有故障事件方案8。“经常出现在失败路径中的人”被认为是占领建筑物或其他位于故障影响区内的其他职业地点的人。出于本手册的目的,这应指资源运营所参与的站点人员以外的其他人,并位于与资源运营相关的物业单位和期限上;对于其他时代,这将是“当局中提到的前提”。应该注意的是,尽管这适合根据本手册评估结果类别,但遵守本手册的要求并没有以任何方式限制,修改或更改,但根据相关的健康和安全法案或法规,必须考虑需要考虑现场人员安全的任何其他要求。9在考虑对地下水的潜在影响时,在所有情况下都没有设想需要进行全面的水文地质评估。对地下水系统的潜在影响的任何考虑都应考虑潜在接收含水层的水质以及储存在受管坝中的流体质量。在资源运营周围地区的现有地下水降低(例如在评估地下水系统上的大坝渗漏后的结果时,还可以考虑由于矿坑或地下矿山脱水而导致的逐渐减少。10'对人类健康的不利影响意味着对人类健康的生理影响,并且不包括对下游水的质量的影响,而下游水的质量仅会对口味产生负面影响,并且不太可能导致人们身体不适。
具有竹节粒结构、顶部覆盖 Al 3 Ti 层并以 W 柱终止的 Al(Cu) 细线是 Si 集成电路中越来越常见的一类互连线。这些线易受跨晶电迁移引起的故障影响。电迁移引起的应力演变可以用一维扩散-漂移方程建模,该方程的解需要了解传输参数。通过开发和执行使用在氧化 Si 基板上制造的单晶 Al 互连线的实验,明确地确定了 Al 中 Al 和 Cu 的跨晶扩散和电迁移特性。在顶部覆盖多晶 Al 3 Ti 覆盖层的钝化 Al 单晶线(2.0 μm 宽,0.4 μm 厚)上进行了加速电迁移寿命测试。覆盖层由 Al 与 Ti 覆盖层的反应形成。电迁移引起失效的激活能确定为 0.94±0.05 eV。以前对没有 Al 3 Ti 覆盖层的 Al 单晶的研究得出的激活能为 0.98±0.2 eV,寿命相似。结论是,Al 3 Ti 覆盖层不会影响跨晶电迁移的动力学和机制。此外,这些结果表明,单晶 Al 互连线电迁移引起失效的限速机制不是扩散,或者令人惊讶的是,Al 沿 Al/Al 3 Ti 界面的扩散率大约等于或低于 Al 沿 Al/AlO 界面的扩散率。还通过实验研究了 Cu 在单晶 Al 线中的扩散和电迁移特性。测试结构由平行线(5.0 μm 宽,0.4 μm 厚)组成,交替线终止于共用接触垫。铜被局部添加到所有线的相同区域,并通过分析 Cu 的浓度分布来表征温度和电流密度的影响
本论文中介绍的工作是在欧洲核子研究中心 LHCb-RICH 子探测器 Ia 阶段升级计划的背景下完成的。在第二次大型强子对撞机 (LHC) 长期关闭期间(预计在 2019 年至 2020 年),LHCb 探测器将升级为以更高的速度执行数据读出,与 LHC 束流穿越率 40 MHz 同步。这涉及完全重新设计 LHCb 读出架构及其子探测器电子设备。LHCb-RICH 探测器上的电子设备将嵌入新的传感器、多阳极光电倍增管 (MaPMT) 和带有辐射硬 ASIC 的新前端电子设备 - CLARO 集成电路。CLARO 读取并转换为数字触发器的 MaPMT 模拟信号将输入到基于 SRAM 的商用级现场可编程门阵列 (FPGA) 中。后者具有反熔丝 FPGA 技术作为备用解决方案。由于这些类型的 FPGA 容易受到辐射引起的故障影响,因此在将这些设备用于目标应用之前,必须在等效辐射环境中测试这些设备。因此,组织了一场激烈的活动,以便在辐射环境中使用不同粒子种类的光束测试和鉴定这些设备:混合场(高中子和强子通量)、质子、离子和 X 射线。在辐射环境中使用时,FPGA 可能会以各种方式发生故障。一些故障是纯软件故障,要么在配置内存中,要么在用户设计电路中,它们表现为位翻转,可能会影响设备的整体功能。纯硬件故障更难缓解,它们表现为 FPGA 中的高电流状态,有时通过电离辐射增加电流消耗。为每个测试的 FPGA 设计了专用的实验装置,以确保正确测试并充分评估辐射响应。为了帮助降低错误率,采用了几种缓解技术并测量了它们的效率。本论文详尽介绍了辐射测试的整个准备过程、结果以及将结果外推到 LHCb-RICH 案例。