在暗硅时代,硬件专业化通常被视为扩展性能的一种方式,现代 SoC 具有数十个专用加速器。通过仅在需要时启动硬件电路,加速器从根本上以芯片面积换取功率效率。然而,暗硅也有一个严重的缺点,那就是它的环境足迹。虽然硬件专业化通常通过高能源效率来减少操作足迹,但是在芯片上集成额外加速器所产生的具体足迹会导致环境足迹的总体净增加,这导致先前的研究得出结论,暗硅不是一种可持续的设计范式。我们通过可重构逻辑探索可持续的硬件专业化,与大量加速器相比,它有可能通过在多个应用程序中摊销其具体足迹来大幅减少环境足迹。我们提出了一个抽象的分析模型,评估用可重构加速器替换专用加速器的可持续性影响。我们针对各种内核,推导出 ASIC 和 CGRA(一种代表性的可重构结构)的芯片面积和能量数字的硬件综合结果。我们将这些结果输入到分析模型中,并得出结论:可重构结构更具可持续性。我们发现,CGRA 可以取代少量到十几个加速器。此外,用 CGRA 取代大量加速器可以大大减少对环境的影响(减少 2.5 倍到 7.6 倍)。
事件摄像机最近显示出对实用视觉任务的有益,例如行动识别,这要归功于其高度分辨率,功率效率和引起的隐私问题。然而,当前的研究是由1)处理事件的困难,因为它们的持续时间长时间和动态动作具有复杂而模棱两可的语义; 2)事件框架表示带有固定堆栈的冗余作用。我们发现语言自然传达了丰富的语义信息,从而使其在降低疾病的不确定性方面非常出色。鉴于此,我们提出了一种新颖的方法,这是第一次解决基于事件的动作识别的跨模式概念化的识别。我们的确切确切带来了两项技术贡献。首先,我们提出了一个自适应细粒事件(AFE)表示,以自适应地过滤固定对象的重复事件,同时保留动态的对象。这巧妙地增强了精确的性能,而无需额外的计算成本。然后,我们提出了一个基于概念推理的不确定性估计模块,该模块模拟了识别过程以丰富语义代表。尤其是,概念推理基于动作语义建立时间关系,而不必要的估计可以解决基于分布表示的动作的语义不确定性。实验表明,在PAF,HADDV和我们的SEACT数据集上,我们的确切确切识别获得了94.83%(+2.23%),90.10%(+2.23%),90.10%(+37.47%)和67.24%。
大多数人工智能算法在现有的计算系统上运行,例如中央处理单元(CPU),图形处理单元(GPU)和现场可编程可编程的门阵列(FPGAS)。(Batra,Jacobson,Madhav,Queirolo和Santhanam,2019年; Viswanathan,2020年),也正在开发用于加速机器学习的数字类型或模拟数字混合信号类型的应用特定的集成电路(ASIC)。然而,随着摩尔法律方法的扩展极限,通过现有扩展可以实现的性能和功率效率正在下降。需要一个特殊的处理器来在短时间内接受和处理学习数据,而该处理器是“ AI半导体”。AI半导体是专门针对效率的非内存半导体,以超高速度和超功率实施AI服务所需的大规模计算。AI半导体对应于核心大脑,学习数据并从中得出推断的结果。(Al-Ali,Gamage,Nanayakkara,Mehdipour,&Ray,2020; Batra等,2019; Esser,Appuswamy,Merolla,Arthur,&Modha,2015年)CPU是处理计算机所有输入,输出和命令处理的计算机的大脑。但是,对于需要大规模并行处理操作的AI,串行处理数据的CPU并未优化。为了克服这一限制,GPU已成为替代方案。gpu是针对3D游戏等高端图形处理开发的,但具有并行处理数据的特征,使其成为AI半导体之一。
在电信基础架构的域中,无线电站(RBSS)内气候控制单元(CCU)的操作对于支持RBS的运行和防止硬件零件的磨损至关重要。但是,CCUS中能量效率的提高仍然引起了研究的关注。本主论文分析了优化RBS中CCU实施的操作和功率节省的方法。主要的目标集中在功率效率和硬件寿命上,为这项研究奠定了基础,从而导致基于机器学习(ML)算法的发展。这些算法用于创建动态预测模型,这些模型负责为托管CCU的特定RB设置最佳温度和风扇速度控制。通过数据驱动的方法涉及数据预处理,探索性分析和模型培训来加强这种ML方法。还通过使用加强学习(RL)方法评估操作方法并评估其对预测模型的贡献,从而加强了工作。结果证明,与传统方法相比,在使用基于RL的方法进行气候控制的同时,粉丝的操作节省了多达70%的能源。开发的算法不仅允许降低能源成本和环境影响,还可以提高电信基础设施的运营可靠性。随着许多RBS在世界范围内部署,这项研究的结果旨在为可持续和绿色的技术做出贡献,并为人工智能(AI)实现现实生活的机会开放。
摘要 - 内部内容可寻址内存(TCAM)一直是缓存,路由器等的关键组件,其中密度,速度,功率效率和可靠性是主要的设计目标。使用了非胆汁记忆(NVM)设备,具有常规的低维能力,但基于SRAM的TCAM设计,但也很密集,但较差,但可靠性较差或更高的功率TCAM设计。同时,还提出了一些使用动态记忆的TCAM设计。尽管动态设计TCAM比CMOS SRAM TCAM更密集,并且比NVM TCAM更可靠,但传统的逐行刷新操作在正常的TCAM活动的干扰瓶颈上升起。因此,本文提出了使用纳米电机力学(NEM)继电器设备的自定义低功率动态TCAM,该中继设备利用一声刷新来解决内存刷新问题。通过使用拟议的新细胞结构来利用独特的NEM继电器特性,提出的TCAM占据了仅3个晶体管的小占地面积(通过后端过程中的两个NEM继电器在顶部集成了两个NEM继电器),这显着超过了基于SRAM-SRAM-SRAM-SRAM-基于SRAM的TCAM的密度。此外,评估表明,拟议的TCAM分别超过了SRAM,RRAM和FEFET TCAM,将写入能效分别提高了2.31倍,131倍和13.5倍。 SRAM,RRAM和FEFET TCAMS分别提高了搜索能量固定产品的12.7倍,1.30倍和2.83倍。
所有可编程的系统内芯片(APSOC)构成了在RA划分环境中采用应用程序的高性能计算和功率效率优点的引人注目的选择。尽管有这些优势,但APSOC像任何其他电子设备一样对辐射敏感。嵌入APSOC中的处理器必须充分地对抗电离辐射,以使其成为恶劣环境设计的可行选择。本文提出了一种基于锁定的新方法,以在Xilinx Zynq-7000 APSOC中硬化双核ARM Cortex-A9处理器,以通过将其与Zynq的可编程逻辑(PL)层中的微型Blaze Blaze TMR子系统耦合,以针对辐射诱导的软误差。所提出的技术使用了检查点的概念以及软件级别的滚动和滚动机制,即软件冗余,以及硬件级别的处理器复制和检查器电路(即硬件Redun Dancy)。故障注射实验的结果表明,提出的方法通过减轻注射到两个手臂核心的寄存器文件中的98%的位液压中的98%的位置,同时将定时性能高达25%,如果块和应用程序尺寸适当调整了25%,则可以实现高水平的防护。因此,在系统中发生下一个错误之前,可以处理相对较大的数据。此外,除了滚动后,滚动前向恢复操作的结合可改善系统的失败(MWBF)之间的平均工作量(MWBF)之间的平均工作量高达≈19%,这取决于运行应用程序的性质,因为该应用程序可以更快地进行,而在情况下发生故障时,与滚动式操作相比,在情况下会发生错误的情况,而不是滚动操作。
企业,贸易和就业局邀请项目提案,要求对欧洲普通利益的重要项目(IPCEI)对微电子和通信技术的重要意义。此呼叫旨在确定在微电子和通信技术领域中活跃的业务,这些企业可能希望提出可能符合即将到来的IPCEI范围内的微电子和通信技术范围内的项目(ME IPCEI2),并应考虑可能的资金。微电源组件与几乎所有工业领域都具有很大的意义,尤其是对于汽车,电信,机械和植物工程,电气和医疗工程,能源供应和消费电子领域。是竞争性5G或6G行业的基础,以及针对行业4.0(基本和以应用程序的)研究和开发以及微电动硬件的生产(传输/接收芯片,快速能效或特殊处理器等)的高性能网络以及生产和欧洲软件的开发是基本的先决条件。范围在微电子和通信技术领域的范围被认为是颠覆性和雄心勃勃的研究与创新(R&I),除了该行业的最先进的创新之外,随后是第一次工业部署,随后是最重要的R&I,在此仍然是必要的(例如,扩大飞行员线路)。因此,资助项目的好处必须不仅限于企业或有关部门,但必须具有更大的意义。此外,对欧盟内部市场的积极影响(例如,在价值链的多个级别或上游或下游市场上的系统相关影响,在经济其他领域的使用)和欧洲社会至关重要,以便对欧洲工业和经济的增长,就业和竞争力做出重要贡献。此外,必须以具体和可识别的方式清楚和定义项目的目标和好处。此IPCEI的主要重点是数字;数据处理;以及与功率效率 /可持续性的沟通。我的目标IPCEI2是通过促进
摇滚乐机制是机器人移动性的众所周知的设计,对于遍布坚固的地形的流浪者尤其有效。这项研究通过集成超声传感器,GPS模块和机械臂来提高自主性和多功能性,从而改善了传统的摇滚系统。该系统由Arduino Uno控制,并使用L298 2A电动机电路板由六个12V DC电动机提供动力,从而确保在充满挑战的环境中精确而可靠的运动。超声波传感器通过触发对象在50厘米以内时触发转弯来提供有效的障碍物检测。这是基于复杂AI的路径计划的更简单的选择。此外,GPS的集成增强了导航功能。机械臂允许与环境相互作用,从而实现了对象操纵和维修等任务。该项目旨在增强自主导航并改善基于传感器的障碍物,这是由实验方法的促进,包括在具有不同障碍距离的受控环境中使用超声波传感器测试漫游者的障碍物检测能力。在不同的地形上评估了流动站的导航,包括平坦的表面和不均匀的地形,以评估其移动性和稳定性。可选地,通过引导漫游者到达预定义的航位来测试GPS的精度,而在连续操作过程中监视功率效率以测量电池寿命和整体系统性能。结果表明。这项工作改善了在恶劣条件下的机器人自主权,并使用机械零件来减少农业,灾难响应机器人,自动矿业车辆,管道和基础设施检查,火山,深层洞穴和极端地形等领域的误差范围。
直到最近,计算机系统的性能和功率效率才随着摩尔定律的扩展和 Dennard 缩放的晶体管效率的提高而稳步提高。然而,现在由于物理限制,设备缩放在性能和功率改进方面遇到了限制。为了在后摩尔和后 Dennard 时代继续生产快速且节能的计算机系统,计算机架构师和系统设计师正在朝着令人兴奋的新方向发展。一个方向是转向并行计算机架构和系统,包括多核和众核处理器、并行执行模型以及新的缓存一致性和内存一致性模型。另一个方向是整合异构和专用加速器,包括 GPU、TPU、FPGA、CGRA 和 ASIC。第三个方向是出现全新的硬件和软件系统,包括量子计算、基于 DNA 的计算机系统、神经形态计算和间歇性计算。本课程将首先回顾计算机设计的基本原理和指令集原理,然后研究当今计算机设计的基本原理,包括高级流水线、指令级并行、内存层次设计、存储系统、互连网络和多处理器。我们还将通过阅读和讨论研究论文、听取和发表技术演讲、在真实和模拟硬件上运行实验以及规划和开展学期研究项目来探索上述三个新方向。本课程将帮助学生为涉及高级计算机架构和系统方面的研究做好准备,或者为国家实验室或公司工作,开发或使用高级架构用于高性能计算、大规模数据分析或机器学习的应用。课程先决条件
企业,贸易和就业局邀请项目提案,要求对欧洲普通利益(IPCEI)对微电子和通信技术的重要项目表示兴趣。此呼叫旨在确定在微电子和通信技术领域中活跃的业务,这些企业可能希望提出可能符合即将到来的IPCEI范围内的微电子和通信技术范围内的项目(ME IPCEI2),并应考虑可能的资金。微电源组件与几乎所有工业领域都具有很大的意义,尤其是对于汽车,电信,机械和植物工程,电气和医疗工程,能源供应和消费电子领域。是竞争性5G或6G行业的基础,以及针对行业4.0(基本和以应用程序的)研究和开发以及微电动硬件的生产(传输/接收芯片,快速能量效率或特殊处理器等)的高性能网络以及生产和欧洲软件的开发是基本的先决条件。范围在微电子和通信技术领域的范围被认为是颠覆性和雄心勃勃的研究与创新(R&I),除了该行业的最先进的创新之外,随后是第一次工业部署,随后是最重要的R&I,在此仍然是必要的(例如,扩大飞行员线路)。因此,资助项目的好处必须不仅限于企业或有关部门,但必须具有更大的意义。此外,对欧盟内部市场的积极影响(例如,在价值链的多个级别或上游或下游市场上的系统相关影响,在经济其他领域的使用)和欧洲社会至关重要,以便对欧洲工业和经济的增长,就业和竞争力做出重要贡献。此外,必须以具体和可识别的方式清楚和定义项目的目标和好处。此IPCEI的主要重点是数字;数据处理;以及与功率效率 /可持续性的沟通。ME IPCEI2的目的是通过促进和生产解决方案的一体化和生产来支持欧洲工业和确保欧洲联盟(EU)行业在全球市场上的竞争力,包括(但不限于):