摘要 - 零知识证明(ZKP)是一种加密工具,使一个方(一个供奉献者)向另一方(供奉献者)证明(一个verifier)是一个陈述是正确的,而无需供供者向Veriifier披露任何数据。ZKP具有许多用例,例如让客户委员会将计算委托给具有加密性正确性的服务器,同时使服务器能够在这些计算中使用秘密数据。ZKP应用程序涵盖了可验证的机器学习(ML)和数据库,在线拍卖,电子投票和区块链。虽然ZKP已被广泛用于区块链,但证明生成的过高成本将它们限制在证明非常简单的计算中。我们提出了一个新颖的加速器NOCAP,该加速器杠杆级的硬件 - 叠加器共同设计以实现变革性的加速。NOCAP生成的证明比32核CPU快586倍,而41倍的速度比PipeZk快41倍,这是最先进的ZKP加速器。我们利用最近的算法开发来实现这些加速:我们识别并结合了两种最近的基于哈希的ZKP算法Orion和Spartan,它们在CPU上具有与先前加速器针对的ZKP相似的性能,但对硬件加速性的态度更为舒张。尽管这些算法产生了更大的证据,但我们表明,末端加速器(包括供奉献时间,证明传输和验证时间)不仅仅证明这种尺寸的增加是合理的。我们为利用这些加速机会的新型硬件组织做出了贡献:NOCAP是一个可编程矢量处理器,其功能单元适合基于哈希的ZKP的需求。结果,NOCAP实现了为ZKP提供新用例的加速。我们还贡献了针对加速器量身定制的Spartan+Orion ZKP的共同设计的实现,并具有优化,可改善并行性并减少存储器的运行。索引术语 - 零知识证明,硬件加速度,可验证的计算
在众多量子计算模型中,量子电路模型是与当前量子硬件交互的最著名和最常用的模型。量子计算机的实际应用是一个非常活跃的研究领域。尽管取得了进展,但对物理量子计算机的访问仍然相对有限。此外,现有机器容易受到量子退相干导致的随机误差的影响,并且量子比特数、连接性和内置纠错能力也有限。因此,在经典硬件上进行模拟对于量子算法研究人员在模拟错误环境中测试和验证新算法至关重要。计算系统变得越来越异构,使用各种硬件加速器来加速计算任务。现场可编程门阵列 (FPGA) 就是这样一种加速器,它是可重构电路,可以使用标准化的高级编程模型(如 OpenCL 和 SYCL)进行编程。 FPGA 允许创建专门的高度并行电路,能够模拟量子门的量子并行性,特别是对于可以同时执行许多不同计算或作为深度管道的一部分执行的量子算法类。它们还受益于非常高的内部内存带宽。本文重点分析了应用于计算流体动力学的量子算法。在这项工作中,我们介绍了基于模型格子的流体动力学公式的新型量子电路实现,特别是使用量子计算基础编码的 D1Q3 模型,以及使用 FPGA 对电路进行高效模拟。这项工作朝着格子玻尔兹曼方法 (LBM) 的量子电路公式迈出了一步。对于在 D1Q3 晶格模型中实现非线性平衡分布函数的量子电路,展示了如何引入电路变换,以促进在 FPGA 上高效模拟电路,并利用其细粒度并行性。我们表明,这些转换使我们能够在 FPGA 上利用更多的并行性并改善内存局部性。初步结果表明,对于此类电路,引入的变换可以缩短电路执行时间。我们表明,与 CPU 模拟相比,简化电路的 FPGA 模拟可使每瓦性能提高 3 倍以上。我们还展示了在 GPU 上评估相同内核的结果。
Taoufik Saidani 沙特阿拉伯北部边境大学计算机与信息技术学院计算机科学系 | 突尼斯莫纳斯提尔大学理学院电子与微电子实验室 (E μ E) taoufik.saidan@nbu.edu.sa(通讯作者)Refka Ghodhbani 沙特阿拉伯北部边境大学计算机与信息技术学院计算机科学系 |突尼斯莫纳斯提尔大学理学院电子与微电子实验室 (E μ E) refka.ghodhbani@nbu.edu.sa Ahmed Alhomoud 沙特阿拉伯北部边境大学计算机与信息技术学院计算机科学系 aalhomoud@nbu.edu.sa Ahmad Alshammari 沙特阿拉伯北部边境大学计算机与信息技术学院计算机科学系 ahmad.almkhaidsh@nbu.edu.sa Hafedh Zayani 沙特阿拉伯北部边境大学工程学院电气工程系 hafedh.zayani@nbu.edu.sa Mohammed Ben Ammar 沙特阿拉伯北部边境大学计算机与信息技术学院信息系统系 mohammed.ammar@nbu.edu.sa
•在计算机科学/电子/电气工程领域完成了技术培训(HTL/FH/UNI)•在计算机视觉领域的多年专业经验•在C和/或C ++下的编程经验数年,良好的Linux知识•良好的Linux知识•非常好的德语和英语团队•具有支持,解决方案和独立的工作量化的交流团队•深入的研究定量量•硬件加速▪GStreamer
推荐系统是许多商业应用程序(例如在线购物网站)的重要工具。有几个问题使推荐任务在实践中非常具有挑战性。首先是需要有效而紧凑的表示来代表用户,项目和关系。第二个问题是在线市场正在动态变化,因此,建议算法适合快速更新和硬件加速。在本文中,我们提出了一种基于HyperDimensional Computing的新硬件友好推荐算法,称为HyperRec。与现有的解决方案不同,在HyperRec中利用浮点数的浮点数,用户和项目用高维度的二进制向量建模。二进制表示形式使仅使用布尔操作仅使用布尔操作执行提出的算法的推理过程,该算法在各种计算平台上有效,适用于硬件加速。在这项工作中,我们展示了如何利用GPU和FPGA加速所提出的HyperRec。与评级预测的最新方法相比,基于CPU的HyperREC实施的速度更快13.75倍,并且记忆力减少了87%,而预测的平均平方误差(MSE)降低了31.84%。与CPU相比,我们的FPGA施加平均更快67.0倍,能源效率更高6.9倍。与FPGA相比,我们的GPU实施平均进一步达到3.1×加速度,同时仅提供1.2倍降低能源效率。
摘要:本次演讲将全面概述安全攻击以及使用可解释人工智能的检测技术。首先,我将概述各种软件和硬件安全威胁和漏洞。接下来,我将介绍可解释的人工智能算法,以人类可理解的方式解释机器学习行为。我将讨论使用可解释人工智能的最先进的攻击检测方法。我还将介绍如何启用可解释人工智能模型的硬件加速以实现实时漏洞检测。最后,我将讨论机器学习模型的安全威胁,以及设计稳健人工智能模型的有效对策。
Eyeq™公司的汽车级高级图像处理和计算机视觉系统(SOC)是其最成功的产品之一,现在是第六代的产品之一,自2007年以来全球超过1.7亿台,仅在2023年就提供了3700万台。以其高性能计算功能和专门的硬件加速处理单元而广泛认可,SOC无缝处理诸如图像识别,对象检测,车道跟踪,交通符号识别,行人检测等任务。这些功能使汽车系统中的智能和实时决策能够增强安全性和驾驶自动化。多年来,Mobileye发布了Eyeq™的几次迭代,每次都提供了提高的性能,功率效率和高级功能。
摘要 未来的太空任务将处理和分析机载图像,对飞行计算提出了更高的要求。即使与笔记本电脑和台式电脑相比,传统飞行硬件提供的计算能力也有限。新一代商用现货 (COTS) 处理器,如 Qualcomm Snapdragon,可在小尺寸重量和功率 (SWaP) 下提供大量计算能力,并以图形处理单元 (GPU) 和数字信号处理器 (DSP) 的形式提供直接硬件加速。我们在 Qualcomm Snapdragon SoC 上对各种仪器处理和分析软件(包括机器学习分类器)进行了基准测试,该 SoC 目前由国际空间站上的 HPE 星载计算机-2 (SBC-2) 托管。索引术语 — 边缘处理、空间应用、机器学习、人工智能
摘要 我们介绍了 Qibo,这是一款新型开源软件,充分利用硬件加速器,用于快速评估量子电路和绝热演化。人们对量子计算日益增长的兴趣和量子硬件设备的最新发展推动了开发注重性能和使用简单性的新型先进计算工具。在这项工作中,我们引入了一个新的量子模拟框架,使开发人员能够将硬件或平台实现的所有复杂方面委托给库,以便他们可以专注于手头的问题和量子算法。该软件从头开始设计,以模拟性能、代码简单性和用户友好界面为目标。它利用硬件加速,如多线程中央处理单元 (CPU)、单图形处理单元 (GPU) 和多 GPU 设备。