摘要 — 语义文本相似性是估计两个文本含义之间的相似性的任务。在本文中,我们通过部分调整模型然后端到端调整,在语义文本相似性基准上对 Transformer 架构进行微调,以实现语义文本相似性。我们通过将问题作为二分类任务或回归任务来尝试 BERT、RoBERTa 和 DeBERTaV3 交叉编码器。我们结合 Transformer 模型的输出,并使用手工制作的特征作为增强算法的输入。由于测试集结果较差,加上验证集的改进,我们尝试使用不同的数据集拆分来进一步调查这种情况。我们还提供了错误分析,重点关注预测范围的边缘。索引术语 — 语义文本相似性、Transformer、增强算法、自然语言处理
根据大学政策 S16-9 (http://www.sjsu.edu/senate/docs/S16-9.pdf),与所有课程相关的大学政策,如学生责任、学术诚信、住宿、退课和加课、同意录制课程等,以及可用的学生服务(例如学习援助、咨询和其他资源)均列在课程信息网页上 (https://www.sjsu.edu/curriculum/courses/syllabus-info.php) (https://www.sjsu.edu/curriculum/courses/syllabus-info.php)。
基站的少量缓冲和重传可防止短切换期间的数据包丢失。在 [9] 中,缓冲发生在移动主机的旧基站,该基站在切换时将数据包转发到新基站。在 [25] 中,附近的一个或多个基站加入与移动主机相对应的多播组并接收发往该主机的所有数据包,以备切换。当切换发生时,新基站能够轻松转发缓冲的和新到达的数据包而无需引入任何重新排序,从而防止不必要地调用 TCP 快速重传。[25] 中报告的实验结果表明,即使切换频率高达每秒一次,这种快速切换对 TCP 性能的不利影响也微乎其微。
稿件收到日期为 2022 年 4 月 11 日;修订日期为 2022 年 6 月 30 日;接受日期为 2022 年 9 月 2 日。当前版本日期为 2022 年 10 月 17 日。Denis Kleyko 的工作部分得到了欧盟“地平线 2020”研究与创新计划(根据玛丽居里资助协议 839179)的支持,部分得到了美国国防高级研究计划局 (DARPA) VIP(超高清项目)和 AIE(HyDDENN 项目)计划的支持,部分得到了空军科学研究办公室 (AFOSR)(资助编号为 FA9550-19-1-0241)的支持,部分得到了英特尔 THWAI 计划的支持。 Pentti Kanerva 的工作部分由 DARPA 的 VIP(超高清项目)和 AIE(HyDDENN 项目)计划资助,部分由 AFOSR(拨款 FA9550-19-1-0241)资助。Bruno A. Olshausen 的工作部分由 DARPA 的 VIP(超高清项目)和 AIE(HyDDENN 项目)计划资助,部分由 AFOSR(拨款 FA9550-19-1-0241)资助,部分由英特尔的 THWAI 计划资助。Jan M. Rabaey 的工作部分由 DARPA 的 VIP(超高清项目)和 AIE(HyDDENN 项目)计划资助。 Dmitri A. Rachkovskij 的工作部分由乌克兰国家科学院资助,资助编号为 0120U000122、0121U000016、0122U002151 和 0117U002286;部分由乌克兰教育和科学部资助,资助编号为 0121U000228 和 0122U000818;部分由瑞典战略研究基金会 (SSF) 资助,资助编号为 UKR22-0024。Friedrich T. Sommer 的工作部分由英特尔的 THWAI 计划资助,部分由 NIH 资助,资助编号为 R01-EB026955,部分由 NSF 资助,资助编号为 IIS-1718991。 (通讯作者:Denis Kleyko。)Denis Kleyko 就职于美国加州大学伯克利分校红木理论神经科学中心,加利福尼亚州伯克利市 94720,同时还就职于瑞典研究机构智能系统实验室,瑞典希斯塔 16440(电子邮箱:denis.kleyko@ri.se)。
量子电子器件,例如量子点接触 (QPC) 和量子点,因具有电自旋控制的潜力而引起了人们对自旋电子学和量子信息处理应用的极大研究兴趣 1–6。这些器件可能构成未来量子电路的构建块,例如基于大量相同量子点使用 QPC 作为电荷传感器的量子比特阵列。为了实现大规模可制造性,首先必须建立可重复性,使得集成电路中的每个组件具有相同的工作参数。传统上,调制掺杂结构已用于量子电子器件,因为其易于制造。然而,随机分布的电离供体的背景静电势大大降低了可重复性 7,8。这种内在的可变性可以通过利用完全未掺杂的结构来避免,通过对金属顶栅施加适当的偏置将电荷载流子限制在异质界面处 9-12 。这些结构有许多优点,包括提高迁移率 13 、提高热循环特性 14 ,以及我们将在这里展示的量子传输特性的优越性。量子点接触是连接两个二维储层的窄一维通道,是最简单的栅极定义量子装置类型,使其成为研究可重复性 7,15,16 的理想选择。我们首先问一个问题:如果在同一晶圆上制造几个相同的装置,它们会表现出相同的行为吗?为了研究这个问题,我们在调制掺杂和未掺杂的晶圆上制造了 18 个名义上相同的 QPC,并观察定义和夹断一维通道所需的栅极偏置。我们还研究了 QPC 通道内电导量子化和静电势的均匀性,以及热循环下的可重复性。为了进行比较,我们还研究了空穴 QPC 中的可重复性。基于 III-V 半导体系统的空穴量子器件最近引起了广泛关注,因为它们
摘要:量子回路的物理合成概念,即合成和物理设计过程之间的相互作用,是在我们以前的工作中首次引入的。这个概念激发了我们提出的一些技术,这些技术可以最大程度地减少在最近邻居建筑上运行电路所需的额外插入交换操作的数量。最小化掉期操作的数量可能会降低量子电路的延迟和误差概率。着眼于这个概念,我们提出了一种基于转换规则的物理综合技术,以减少最近邻里建筑中交换操作的数量。将电路的Qubits映射到目标体系结构提供的物理量子位之后,我们的过程被此映射信息提供了。我们的方法使用获得的位置和调度信息将某些转换规则应用于原始Netlist,以减少在体系结构上运行电路所需的额外交换门的数量。我们遵循两项政策,以应用转换规则,贪婪和基于仿真的策略。仿真结果表明,与文献中最好的基于贪婪和基于模拟的基于基于通量的策略,该提出的技术分别将额外掉期操作的平均数量降低了约20.6%和24.1%。
摘要 - 尽管具有巨大的潜力,但仍不清楚量子计算如何扩展以满足其最强大的应用程序的要求。除其他问题外,可以将可以集成到单个芯片中的量子位数量很大。多核架构是解锁量子处理器可扩展性的公司候选者。尽管如此,量子通信的脆弱性和复杂性使这是一个具有挑战性的方法。全面的设计应意味着整合量子计算机体系结构中的通信堆栈。在本文中,我们通过在设计核心中纠缠沟通和计算可能有助于解决开放挑战来解释这种愿景。我们还总结了我们应用结构化设计方法支持该愿景的第一个结果。通过我们的工作,我们希望通过设计指南做出贡献,这些指南可能有助于释放量子计算的潜力。
量子电路优化对于提高量子计算的实用性和效率至关重要。特别是,为了满足量子电路急需的紧凑性,可逆电路的合成正在被深入研究。由于 T 门具有较高的容错实现成本 [1],因此人们投入了大量工作来最小化 T 数量 [2–9] 和 T 深度 [10–13]。相比之下,CNOT 门的实现成本较低,因为它是 Clifferd 群的一部分 [14]。尽管如此,基于 T 门的度量的使用有局限性,事实证明,电路中 CNOT 门的数量是一个不容忽视的度量,因为它会对电路的实现成本产生重大影响 [15]。除此之外,噪声中尺度量子 (NISQ) 时代的量子计算机 [16] 具有架构限制。具体而言,这些计算机中的量子比特并非以全对全的方式连接。这意味着具有 2 的元数的逻辑门(例如 CNOT 门)只能应用于某些量子比特对之间。因此,使电路符合给定架构不可避免地会导致 CNOT 计数增加 [17]。处理架构约束的一种常见方法是插入 SWAP 门来路由逻辑量子比特 [18–21]。另一种方法是执行架构感知合成 [22],这种方法通常会产生具有低得多的 CNOT 计数的电路,同时满足架构约束。这种方法通常应用于可以用高级构造(例如线性可逆函数)表示的电路子集。然后可以将这些电路组合在一起以形成完整的架构兼容量子电路 [23, 24]。此编译方案中的一个重要构建块是合成仅由 CNOT 和 RZ 门组成的电路。这些电路可以用称为相位多项式的高级构造来表示。在这项工作中,我们解决了相位多项式合成问题,并针对受限和完全连接的情况提出了有效的算法。
摘要 — 得益于研究人员在过去几年取得的快速进展,量子计算机如今已成为现实。在构建量子计算机的过程中,IBM 开发了多个版本 — 从 IBM QX2 和 IBM QX4 等 5 量子比特架构开始,到更大的 16 或 20 量子比特架构。这些架构支持单个量子比特的任意旋转和涉及两个量子比特的受控否定 (CNOT)。这两个量子比特操作带有附加的耦合映射限制,仅允许特定物理量子比特成为操作的控制和目标量子比特。为了在 IBM QX 架构上执行量子电路,CNOT 门必须满足架构的所谓耦合约束。先前的研究解决了这个问题,目的是减少门的数量和电路深度。然而,在这项研究中,我们表明可以进一步改进。为此,我们提出了一种通用方法来进一步提高门操作的数量和映射电路的深度。所提出的方法包括选择物理量子比特、有效确定初始和局部置换,以获得映射到给定 IBM QX 架构的最终电路。通过实验,我们发现在门数和电路深度方面,该方法比现有方法有所改进。
摘要 - 基于CPU的推理可以作为外芯片加速器的拟合作用。在这种情况下,由于其高效率,新兴的矢量体系结构是一个有前途的选择。然而,卷积算法和硬件实现的庞大设计空间使设计选项的选择具有挑战性。在本文中,我们介绍了针对基于CPU的卷积神经网络(CNN)推断的共同设计的未来矢量体系结构的持续研究,重点是IM2Col+Gemm和Winograd内核。使用GEM5模拟器,我们探讨了几个硬件微体系特征的影响,包括(i)向量泳道,(ii)向量长度,(iii)缓存尺寸和(iv)将向量单元集成到CPU管道中的选项。In the context of im2col+GEMM, we study the impact of several BLIS-like algorithmic optimizations such as (1) utilization of vector registers, (2) loop unrolling, (3) loop reorder, (4) manual vectorization, (5) prefetching, and (6) packing of matrices, on the RISC-V Vector Extension and ARM-SVE ISAs.我们使用Yolov3和VGG16网络模型进行评估。我们的共同设计研究表明,BLIS样的优化对所有类型的矢量微体系结构都不是有益的。我们还证明,与我们优化的CNN内核相比,较长的矢量长度(至少为8192位)和较大的缓存(256MB)可以提高5倍的性能,而512位和1MB的载体长度则可以提高性能。我们的共同设计研究还表明,与IM2Col+GEMM相比,Winograd需要较小的缓存尺寸(高达64MB)。在Winograd的背景下,我们通过使用每个通道的8×8图块来介绍跨输入/输出通道之间的新颖的瓷砖并行方法,以对向量长度不可知(VLA)体系结构进行载体化算法。我们的方法利用了较长的向量长度并提供了高内存重复使用,与我们在Fujitsu A64FX处理器上优化的IM2Col+Gemm方法相比,对于具有3×3内核大小的非弯曲卷积层的性能提高了2.4倍。索引术语 - CNN,GEMM,Winograd,长量架构,向量长度不可知论ISA,共同设计,优化