大型多项式乘法对于基于模块的键盘封装机制(ML-KEM)和基于模块的数字签名(ML-DSA)(ML-DSA)等量子后加密标准标准至关重要。这些复杂的这些乘法通常使用数字理论变换(NTT)加速。这项工作介绍了一种新型的架构,具有高性能NTT加速器,能够使用一组硬件资源来执行NTT和逆NTT操作。设计利用单个蝴蝶配置单元来减少资源需求并改善关键路径。采用多路径延迟分组(MDC)策略来实现多个系数的完全管道和并行处理,从而支持ML-KEM和ML-DSA计算。实际结果表明,我们提出的NTT发动机需要3,821个LUTS,2970 FFS,20 DSP和5 BRAM,在AMD Zynq Ultrascale+ FPGA上需要322 MHz。我们的设计在当前的NTT体系结构中提供了最佳的区域时间产品(ATP)。
主要关键词