摘要 本教程将讨论数据中心/服务器以及 AI 和机器学习系统中使用的 48V 至 0.7V (2,000A) 电源转换器所面临的挑战和解决方案。将讨论和比较两种电源架构。第一种架构是两级架构,其中 48V 转换为 12V(或另一个中间电平),然后将 12V 转换为 0.7V。第二种架构是“单级”,其中 48V“直接”转换为 0.7V。使用“直接”转换架构,无法访问(可见)中间电压总线。在简要介绍广泛应用于数据中心、服务器等的 OAM(OCP 加速器模块)的背景信息和功率要求之后,本教程将提供对降低功率损耗和提高功率密度的技术的新认识。本教程将首先回顾两级架构的最新技术并评估其优点和局限性。然后,本教程将回顾“单级”架构的最新技术并评估其优缺点。基于上述分析和回顾,本教程将提出并讨论 48V 至 0.7V(低至 0.3V)、2,000A(或更高)的应用研究方向,以实现极高的效率、极小的尺寸和电流共享、可扩展、快速动态响应等。
摘要 卷积神经网络(CNN)在图像处理领域得到了广泛的应用,基于CNN的目标检测模型,如YOLO、SSD等,已被证明是众多应用中最先进的。CNN对计算能力和内存带宽要求极高,通常需要部署到专用的硬件平台上。FPGA在可重构性和性能功耗比方面具有很大优势,是部署CNN的合适选择。本文提出了一种基于ARM+FPGA架构的带AXI总线的可重构CNN加速器。该加速器可以接收ARM发送的配置信号,通过分时方式完成不同CNN层推理时的计算。通过结合卷积和池化操作,减少卷积层和池化层的数据移动次数,减少片外内存访问次数。将浮点数转换为16位动态定点格式,提高了计算性能。我们分别在 Xilinx ZCU102 FPGA 上为 COCO 和 VOC 2007 上的 YOLOv2 和 YOLOv2 Tiny 模型实现了所提出的架构,在 300MHz 时钟频率下峰值性能达到 289GOP。
量子计算机需要误差校正以实现量子优势。他们还需要校准大量参数,以正确操作Qubits,这可能只有53 QUBITS的Google Sycamore需要几个小时。扩展量子计算需要快速,可扩展和屈曲反馈以实现量子误差校正(QEC)和加速校准。QEC和校准都需要电子设备,以测量,计算和应用最低潜伏期的反馈。使用当今的电子设备必须扩展到数千个Qubits。FPGA是理想的选择,因为它们可以重新编程以满足不同的实验需求,同时达到了非常低的反馈延迟。典型的量子操作实验(图1)涉及在室温下通过数字转换器(DAC)(DACS)和对数字转换器(ADCS)的模拟转换器(ADC)的FPGA网络。用于自旋Qubits,控制信号由两种类型组成。首先,基于纳秒坡道的准静态控制,以调整Qubits的潜在井和耦合以改变其状态。其次,通过I/Q调制控制的Ra-dio频率脉冲,用于测量或基于共振的控制。数字混合用于实现更复杂的控制方案和脉搏工程。完整的数字发电提高了灵活性并减少了噪声源。我们使用直接生成的坡道和频率梳子提出了可扩展的,复杂的信号发生器(CSG),以减少
提供的信息不能被视为保证的特征。数据可以更改而无需通知。提供的信息可以受到专利或其他权利保护。Cologne Chip产品不是在任何旨在支持或维持生命的申请中设计,打算或授权使用的,或者用于Cologne Chip产品失败可能会造成人身伤害或死亡的任何其他应用。
摘要 —混沌序列伪随机数生成器 (PRNG-CS) 在各种安全应用中引起了关注,尤其是对于流和分组密码、隐写术和数字水印算法。事实上,在所有基于混沌的加密系统中,混沌生成器都起着至关重要的作用并表现出适当的加密特性。由于技术的爆发,以及物联网 (IoT) 技术的快速发展及其各种用例,PRNGs-CS 软件实现仍然是一个未解决的问题,以满足其服务要求。硬件实现是实现 PRNGs-CS 的最旗舰技术之一,目的是为此类应用程序安全提供高性能要求。因此,在这项工作中,我们提出了一种新的基于 PRNGs-SC 的架构。后者由三个弱耦合的离散混沌映射以及分段线性混沌映射 (PWLCM)、斜帐篷和 Logistic 映射组成。混沌系统是在 Xilinx Spartan™-6 FPGA 板上设计的,使用超高速集成电路硬件描述语言 (VHDL)。在 ISE Design Suite 环境中执行的模拟结果证明了我们提出的架构在抵抗统计攻击、吞吐量和硬件成本方面的有效性。因此,基于其架构和模拟结果,所提出的 PRNG-SC 可用于加密应用。
摘要 — 后量子密码学代表了一类抵抗量子算法的密码系统。此类方案在 NIST 标准化过程中受到数学安全性的严格审查,但它们在算法级别上并不安全。这就是为什么研究界必须评估它们的侧信道漏洞。在本文中,我们针对标准密钥封装机制 CRYSTALS-Kyber 的 FPGA 实现进行了非分析相关电磁分析。攻击将多项式乘法执行的电磁辐射模型与捕获的轨迹相关联。通过 166,620 条轨迹,此攻击正确恢复了 100% 的子密钥。此外,还提出了一种对策,以确保目标实现免受所提出的攻击。
摘要 - 基于表面肌电图(SEMG)的分析的手动运动的准确建模为开发复杂的假体设备和人机界面的开发提供了令人兴奋的机会,从离散的手势识别转向连续运动跟踪。在这项研究中,我们基于轻量级尖峰神经网络(SNN)和在晶格ICE40-ultraplus FPGA上实施了两种实时SEMG加工的解决方案,特别适用于低功率应用。我们首先评估离散手势识别任务中的性能,考虑到参考Ninapro DB5数据集,并在十二个不同的固定手势的分类中占83.17%的准确性。我们还考虑了连续填充力建模的更具挑战性的问题,在独立的扩展和收缩练习中引用了用于填充跟踪的Hyser数据集。评估表明,高达0.875的相关性与地面真正的力。我们的系统利用了SNN的固有效率,并在活动模式下消散11.31 MW,以进行手势识别分类的44.6 µJ,用于强制建模推理的手势识别分类和1.19 µJ。考虑动态功率消费管理和引入空闲时期,对于这些任务,平均功率下降至1.84兆瓦和3.69兆瓦。
Nikolaos Alachiotis,Twente大学,荷兰Sjoerd van den Belt,Twente大学,荷兰史蒂文·范·德·弗鲁格特(Steven van der Vlugt),荷兰射电天文学研究所(Astron) Twente,荷兰Tiziano de Matteis,Vrije Universiteit Universitiit,荷兰ZAID AL-ARS,DELFT技术大学,荷兰Roel Jordans * Baaij,Qbaylogic BV,荷兰ANA-LUCIA VARBANESCU,TWENTE大学,荷兰
本文介绍了一种测试台的开发,用于测量 Xilinx 的 Zynq UltraScale + FPGA 中使用的 16nm FinFET 的老化情况。在设置中选择并实施了环形振荡器 (RO) 漂移测量方法。然而,RO 电路不仅对老化敏感,而且对温度和电压也敏感。为了减轻对温度和电压的不良敏感性,我们安装了一个调节系统来控制 FPGA 的温度和内部电压,并根据温度和电压表征 RO 频率以应用后测量补偿。我们通过使用 GPS 信号作为时间参考改进了测量电路。进行了 1000 小时测试,测试温度为 (T FPGA = 100 ◦ C) ,测试温度为 (V FPGA = V nom + 25%),结果显示 RO 频率漂移明显低于 0.1%,测量精度为 0.9 × 10 − 4。
•打开主题演讲:Altera FPGA安全专家Anthony Cartolano。‘fpgaaipqcccrabbq,或如何解码(生存?)网络风暴的网络安全捕获了头条新闻,频率令人震惊。在AI,量子计算机,软件平台和政府查询之间,很难避免每日中断,更不用说完整的合理产品开发周期了。在这次演讲中,我们将研究最近的趋势,包括人工智能,量词后加密术以及更多的趋势对产品设计师提出了令人难以置信的需求。我们将展示FPGA如何以及为何非常适合帮助设计师在当前的迅速变化的要求中生存,并准备应对整个生命周期的挑战。最后,我们将讨论FPGA如何准备满足《网络弹性法》的要求。