[1] F. Bellard,“ Qemu,快速和便携式动态翻译器。”,在Usenix年度技术会议上,Freenix Track,第1卷。41,pp。10–5555,美国加利福尼亚,2005年。[2]“ Spike Risc-V ISA模拟器。” https://github.com/riscv- software-src/riscv-isa-sim。访问:2024-03-12。[3] J. L. Power和等,“ Gem5模拟器:20.0+版本”,Corr,Vol。ABS/2007.03152,2020。[4] C. Lattner和等,“ MLIR:针对域特定计算的缩放编译器基础架构”,2021年(CGO),pp。2–14,IEEE,2021。[5] C. Lattner和V. Adve,“ LLVM:终身计划分析与转型的汇编框架”,CGO2004。,pp。75–86,IEEE,2004年。[6] H.-I.C. Liu,M。Brehler,M。Ravishankar,N。Vasilache,B。Vanik和S. Laurenzo,“ Tinyiree:从编译到部署到部署的嵌入式系统的ML执行环境”,IEEE Micro,第1卷。 42,否。 5,pp。 9–16,2022。C. Liu,M。Brehler,M。Ravishankar,N。Vasilache,B。Vanik和S. Laurenzo,“ Tinyiree:从编译到部署到部署的嵌入式系统的ML执行环境”,IEEE Micro,第1卷。42,否。5,pp。9–16,2022。
RISC-V矢量加密扩展(ZVK)在2023年批准并集成到2024年的ISA主要手册中。这些表面支持在矢量寄存器文件上运行的高速对称加密(AES,SHA2,SM3,SM4),并且由于数据并行性而对标量密码扩展(ZK)提供了显着的性能改进。作为批准的扩展名,ZVK由编译器工具链提供支持,并且已经集成到流行的加密中间件(例如OpenSSL)中。我们报告了玛丽安(Marian),这是带有ZVK扩展程序的向量处理器的第一个开源硬件实现。设计基于纸浆“ ARA”矢量单元,该矢量单位本身就是流行的CVA6处理器的扩展。该实现位于SystemVerilog中,并已使用Virtex Ultrascale+ FPGA原型制作进行了测试,其计划的磁带针对22nm的过程节点。我们对矢量密码学对处理器的架构要求进行分析,以及对我们实施的绩效和面积的初步估计。
最近,人们对量子最优控制和变分量子算法相互作用的兴趣和见解激增。我们在量子比特的背景下研究该框架,例如,量子比特可定义为与传输器耦合的超导腔系统的可控电磁模式。通过采用 (Petersson and Garcia, 2021) 中描述的最新量子最优控制方法,我们展示了对多达八个状态的单量子比特操作和两个量子比特操作的控制,分别映射到谐振器的单个模式和两个模式。我们讨论了对参数化门的封闭系统进行数值脉冲工程的结果,这些门可用于实现量子近似优化算法 (QAOA)。结果表明,对于大多数研究案例,在足够的计算努力下,可以实现高保真度 (> 0.99),并且可以扩展到多种模式和开放的噪声系统。定制的脉冲可以被存储起来并用作电路量子电动力学 (cQED) 系统中未来编译器的校准原语。
GROQ的体系结构与高批量GPU的相反,GROQCHIP处理器具有230 MB的SRAM,可提供80TB/s的芯片带宽。图3显示了Groqchip如何非常有效地揭示指令级别并行性,记忆级并行性和数据级并行性,从而同时采用了计算和交流的独特方法。开发后,控制权被移交给软件端,以构建一个大规模的并行编译器,以利用所有这些形式的并发。这有助于有助于Groq在批次1.在其他体系结构中,必须处理256个用于培训的256 BA TCH,这意味着必须处理256张图像,并且“在应用程序可以提供有关第一个的信息之前从''中学到的图像。在GROQ在批次1运行,因此在收到的每个图像时处理每个图像(而不是等待所有256),不仅等待降低,精度会提高。另外,GROQ架构允许开发人员不摊销GPU和其他传统体系结构中固有的长潜伏期。
COME306 数字信号处理 3 0 0 3 5 ARB124 阿拉伯语 II 3 0 0 3 5 COME310 实时系统 3 0 0 3 5 CHN123 中文 I 3 0 0 3 5 COME311 数据安全 3 0 0 3 5 CHN124 中文 II 3 0 0 3 5 COME312 用户界面设计 3 0 0 3 5 ESP123 西班牙语 I 3 0 0 3 5 COME313 数学建模 3 0 0 3 5 ESP124 西班牙语 II 3 0 0 3 5 COME314 控制系统简介 3 0 0 3 5 FRN123 法语 I 3 0 0 3 5 COME317 智能机器人 2 0 2 3 5 FRN124 法语 II 3 0 0 3 5 COME318 计算机图形学 3 0 0 3 5 GER123 德语 I 3 0 0 3 5 COME319 移动编程 2 0 2 3 5 GER124 德语 II 3 0 0 3 5 COME324 可视化编程 2 0 2 3 5 RSN123 俄语 I 3 0 0 3 5 COME326 网络编程 2 0 2 3 5 RSN124 俄语 II 3 0 0 3 5 COME401 数据挖掘 3 0 0 3 5 COME402 人工神经网络 3 0 0 3 5 COME403 软件工程 3 0 0 3 5 COME404 模糊控制器 3 0 0 3 5 COME405 人工智能 3 0 0 3 5 COME406 并行计算 3 0 0 3 5 COME407 图像处理 3 0 0 3 5 COME408 网络安全 3 0 0 3 5 COME409 自动机理论 3 0 0 3 5 COME410 系统编程 3 0 0 3 5 COME411 系统分析与设计 3 0 0 3 5 COME412 嵌入式系统 3 0 0 3 5 COME414 优化技术 3 0 0 3 5 COME416 编译器设计 3 0 0 3 5 COME418 自然语言处理 3 0 0 3 5 COME420 生物医学和实验室仪器 3 0 0 3 5 COME422 脑机接口简介 3 0 0 3 5
教育1997博士在计算机科学卡内基·梅隆大学(Carnegie Mellon University)主题:“目标导向不完整的信息”顾问:西蒙斯,论文委员会:西蒙斯,米切尔,摩尔,科夫(UCLA)1993年M.S.计算机科学(专业:人工智能)卡内基·梅隆大学顾问:Simmons 1992外交官(德语M.S.)计算机科学(专业:编译器建设,人工智能)汉堡大学(总成绩:很好)顾问:Neumann 1991 M.S. 在计算机科学(次要:语言学)伯克利分校的主题:“使用马尔可夫决策理论的最佳概率和决策理论计划”顾问:Russell和Norvig,Master's论文的第二读者:Zadeh 1991 Diplom(德语M.S.) 汉堡大学(专业:市场/EDP)(整体成绩:非常好)顾问:Preßmar,Master's论文的第二读者:Hummeltenberg 1987 Vordiplom(德语B.S.) 汉堡工商管理大学1986年福尔德利普罗姆(德语B.S.) 汉堡计算机科学大学计算机科学(专业:编译器建设,人工智能)汉堡大学(总成绩:很好)顾问:Neumann 1991 M.S.在计算机科学(次要:语言学)伯克利分校的主题:“使用马尔可夫决策理论的最佳概率和决策理论计划”顾问:Russell和Norvig,Master's论文的第二读者:Zadeh 1991 Diplom(德语M.S.)在计算机科学(次要:语言学)伯克利分校的主题:“使用马尔可夫决策理论的最佳概率和决策理论计划”顾问:Russell和Norvig,Master's论文的第二读者:Zadeh 1991 Diplom(德语M.S.)汉堡大学(专业:市场/EDP)(整体成绩:非常好)顾问:Preßmar,Master's论文的第二读者:Hummeltenberg 1987 Vordiplom(德语B.S.)汉堡工商管理大学1986年福尔德利普罗姆(德语B.S.)汉堡计算机科学大学
当前的量子处理器噪声大、相干性有限且门实现不完善。在这样的硬件上,只有比整体相干时间短的算法才能成功实现和执行。一个好的量子编译器必须将输入程序转换为其自身最有效的等价物,从而充分利用可用的硬件。在这项工作中,我们提出了新的确定性算法,用于在多项式时间内编译递归量子电路模式。具体来说,这种模式出现在量子电路中,这些量子电路用于使用变分量子特征求解器 (VQE) 方法和 RyRz 启发式波函数 Ans¨atz 计算分子系统的基态特性。我们表明,我们的面向模式的编译算法与有效的交换策略相结合,在 CNOT 计数和 CNOT 深度方面,通常可以生成与使用最先进的编译器获得的输出程序相当的输出程序。特别是,我们的解决方案在 RyRz 电路上产生了无与伦比的结果。关键词 - 量子编译、循环模式、RyRz 电路
CSC23C201 数字逻辑 3+1+0=4 CSC23C301 数据结构 3+0+1=4 CSC23C302 数学-I 3+1+0=4 CSC23C401 数据库管理系统 3+0+1=4 CSC23C402 Python 编程 3+0+1=4 CSC23C403 计算机组织与架构 3+1+0=4 CSC23C501 计算理论 3+1+0=4 CSC23C502 数值方法 3+1+0=4 CSC23C503 面向对象编程 3+0+1=4 CSC23C504 算法设计与分析 3+0+1=4 CSC23C601 人工智能 3+1+0=4 CSC23C602 操作系统 3+0+1=4 CSC23C603 计算机网络 3+0+1=4 CSC23C604 软件工程 3+1+0=4 CSC23C701 图像处理和计算机视觉 3+0+1=4 CSC23C702 机器学习 3+0+1=4 CSC23C703 编译器设计 3+1+0=4 CSC23C704 软计算 3+1+0=4 CSC23C801 移动计算 3+1+0=4 CSC23C802 网络安全和密码学 3+1+0=4 CSC23C803 数据挖掘 3+0+1=4 CSC23C804 深度学习 3+0+1=4 计算机科学与信息技术系提供的辅修课程清单 论文代码 论文标题 学分 (LTP) CSC23M101 使用 C 语言进行编程和解决问题
摘要在本文工作中,我们探讨了在微控制器上的AI解决方案的部署。在硬件上探索,测试和验证了当前可用的所有AI解决方案,并认为要部署在微控制器上的AI解决方案。32位微控制器是该开发的一部分,因为AI应用程序的任何平台不支持8位微控制器。STM32L432KC,带有64kbytes的SRAM和256kbytes闪存用于测试AI模型。微控制器的当前AI解决方案在供应商的礼物,开源和编译器基础上彼此不同。适用于微控制器,STM32 AI Cube和开源库NNOM的Google Tensorflow Lite用于构建和培训AI模型。每个AI解决方案的结果与其他四个核心参数闪存,RAM占用率,推理和输出偏差的时间进行了比较。优化诸如量化和仅使用微控制器的C源代码之类的技术。c和c ++在代码大小和推理时间上产生了很大的差异。在末尾,AI解决方案通过翻转内存位并更改微控制器代码来测试AI解决方案的编译时间注入故障。
摘要:随着小型量子处理器从实验物理实验室过渡到工业产品,这些处理器有望在几年内扩大规模并变得更加强大,以高效计算各个领域的重要算法。在本文中,我们提出了一种量子算法来解决基因组序列重建数据处理这一具有挑战性的领域。这项研究描述了一种用于子序列比对的量子算法的架构感知实现。提出了一种名为 QiBAM(量子索引双向联想记忆)的新算法,该算法使用基于汉明距离的近似模式匹配。QiBAM 从两个方面扩展了 Grover 的搜索算法,允许:(1)基因组学中读取错误所需的近似匹配,以及(2)在 DNA 序列的量子编码上分布式搜索多个解决方案。这种方法比传统算法的速度提高了二次。提供了该算法的完整实现,并使用 OpenQL 编译器和 QX Simulator 框架进行了验证。我们的实施代表了对全栈量子加速基因组测序管道设计的首次探索。