随着电子设备的小型化,辐射环境中的内存故障数量也在增加。一维 (1D) 纠错码 (ECC) 无法有效缓解这些问题,需要二维 (2D)-ECC 来提供卓越的纠错能力,同时减少能耗和面积消耗。该领域的出版物数量大幅增加,需要开展一项研究来指导和资助研究决策,主要是为了确定一种比较和评估 ECC 的标准化方法。我们提出了系统文献综述 (SLR),以研究用于缓解内存故障的 2D-ECC 的最重要特征。该 SLR 揭示了最常用的 ECC、数据大小和冗余开销、编码器和解码器实现技术、故障注入方法和评估指标。此外,我们提取了一些 ECC 趋势,例如在解码器内重复使用编码器,并以三维 (3D)-ECC 为目标来提高纠错效率。实验结果描述了对该科学界具有重要价值的重要研究决策。
• 早期故障(也称为早期失效):其特点是初始故障率相对较高,但随后会迅速降低。可以通过执行加速寿命测试(如老化或 I DDQ 测试)进一步减少早期故障,这些测试是德州仪器 (TI) 工厂出厂测试的一部分。早期故障主要是由未有效筛选的制造缺陷引起的。缺陷总是会发生。开发和持续改进有效的筛选是一项要求。• 正常寿命故障:这是浴缸曲线的区域,其中故障率相对较低且恒定。BFR 估算解决了半导体元件生命周期的这一部分。此故障率以故障时间 (FIT) 为单位进行量化 - 这是产品运行十亿 (10 9 ) 个累计小时内可能发生的故障数量的估计值。• 固有磨损:这是产品生命周期中固有磨损占主导地位且故障呈指数增加的时期。产品使用寿命的结束被指定为磨损开始的时间。这些类型的故障是由众所周知的因素引起的,例如通道热载流子效应、电迁移、时间相关的电介质击穿和负偏置温度不稳定性。ISO 26262 和 IEC 61508 等功能安全标准不支持基于非常量故障率计算随机硬件指标。因此,在产品的整个生命周期内,使用一个恒定的(但悲观的)近似值来估计 BFR。系统集成商必须应对正常使用寿命期间的随机硬件故障以及磨损的开始。在这种情况下,系统集成商必须依靠安全机制,它提供了一定的
拜占庭式缺陷耐受性(BFT)状态机器复制(SMR)协议构成了现代区块链的基础,因为它们在所有区块链节点上保持一致的状态,同时耐受界数的拜占庭故障数量。我们在过度故障设置中遇到了Alyze BFT SMR,拜占庭断层的实际数量超过了协议的公差。我们首先设计了第一种基于链式和法定人数的第一种修复算法部分同步SMR,以从过度故障引起的错误状态中恢复。可以使用任何佣金故障检测模块来实现此类过程 - 一种算法,该算法可以识别故障复制品而不错误地找到任何正确的复制品。我们以稍弱的可将其保证来实现这一目标,因为在过多的故障的情况下,原始的策略概念是不可能满足的。我们在Rust中实现可回收的热门。在恢复例程终止7副复制品后,通行简历达到了正常水平(没有过多的故障),并略微缩短了≤4。30副复制品的3%。平均而言,它将延迟增加12。7%的7%和8个复制品。30副本的85%。除了采用现有检测模块外,我们还为一般的BFT SMR供应机构建立了足够的条件,以便在最多(n-2)拜占庭式复制品(来自n个总复制品中)的完全故障检测。我们首先为任何SMR协议提供第一个闭合盒故障检测算法,而无需任何额外的通信。然后,我们在Tendermint和Hotstuff中描述了我们的断层检测例程的开盒构成,进一步逐渐降低了渐近和具体的开销。
ANITA 来自厚靶的类大气中子 CAL 控制轴向寿命 CIA 电流诱导雪崩 DN 深 N 缓冲层 DUT 被测设备 FEM 有限元法 FIT 及时失效 FWD 续流二极管 IC 集成电路 IGBT 绝缘栅双极晶体管 LANSCE 洛斯阿拉莫斯中子科学中心 LET 线性能量传递 MCNP 蒙特卡罗 N 粒子 MOSFET 金属氧化物半导体场效应晶体管 MTTF 平均故障时间 NPC 中性点钳位 NPT 非击穿 NYC 纽约市 PID 比例 – 积分 – 导数 PSI 保罗谢尔研究所 PT 击穿 PWM 脉冲宽度调制 QARM Qinetic 大气辐射模型 RCNP 核物理研究中心 SEB 单粒子烧毁 TCAD 技术计算机辅助设计 E av 空间平均电场 P f 总设备故障率 P lf 局部设备部分故障率 RB 体区扩展电阻 T 0 温度常数 ti 故障时间 T j 结温 T SUM 器件通量积数量 V aval 雪崩电压 V CE 集电极-发射极电压 V DC 直流电压 V DS 漏源电压 Δ fi 故障通量 A 面积 E 电场 h 高度 i 故障事件总和 r 器件故障数量 Si 硅 SiC 碳化硅 ε 介电常数 λ 故障时间 ρ 净电荷密度 Ω 器件体积
美国宇航局的连续失败不容忽视。航天飞机发射的巨额开支使美国宇航局在国际市场上失去了竞争力,无法发射用于研究天气、国际通信系统或全球表面测绘等实用卫星。在航天飞机计划开始时,美国宇航局宣布,这笔巨额投资将很快得到回报,因为它将使太空发射比一次性助推器便宜得多。但 20 年后的今天,事实却截然相反:将每磅重物发射到近地轨道的成本比其他几个国家同时开发的无人一次性助推器高出许多倍。此外,灾难和险些发生的灾难清楚地表明,航天飞机不是一种安全的发射系统。除此之外,我们还目睹了一系列大规模的失败。哈勃太空望远镜耗资 20 亿美元,但其设计缺陷十分严重,在发射前,只需花费很少的额外费用,用相当简单、高精度的测量仪器就能发现。最近的修复任务能否成功还有待观察。但修复成本(6.3 亿至 12 亿美元)必定会降低人们对修复的热情,因为修复最多不能使仪器达到最初预期的性能。需要修复的独立严重故障数量之多,无法做出良好的预测。伽利略号探测木星及其卫星的任务耗资超过 10 亿美元,可能仍会取得一些成果,但展开航天器天线时发生的机械故障将阻止其将所有结果发回地球。现在,在一系列耗资巨大的航天飞机发射失败之后,另一个耗资近 10 亿美元的重大项目——火星轨道器,也莫名其妙地失败了。同样,一颗地球测绘卫星(Landsat 系列的延续)现在正无用地漂浮在某个未知的地球轨道上。考虑到巨大的成本,一个经过精心规划的项目会遭遇如此接二连三的失败吗?20 世纪 70 年代初,人们非常仔细、详细地讨论了规划太空研究项目的问题。一些外部顾问委员会(一些由 NASA 设立,一些由白宫科技办公室设立)提出了许多详细的建议,这些建议包括: