直接语音到语音翻译 (S2ST) 使用单一模型将语音从一种语言翻译成另一种语言。然而,由于语言和声学多样性的存在,目标语音遵循复杂的多模态分布,这对 S2ST 模型实现高质量翻译和快速解码提出了挑战。在本文中,我们提出了 DASpeech,这是一种非自回归直接 S2ST 模型,可实现快速和高质量的 S2ST。为了更好地捕捉目标语音的复杂分布,DASpeech 采用两遍架构将生成过程分解为两个步骤,其中语言解码器首先生成目标文本,然后声学解码器根据语言解码器的隐藏状态生成目标语音。具体而言,我们使用 DA-Transformer 的解码器作为语言解码器,并使用 FastSpeech 2 作为声学解码器。DA-Transformer 使用有向无环图 (DAG) 对翻译进行建模。为了在训练过程中考虑 DAG 中的所有潜在路径,我们通过动态规划计算每个目标 token 的预期隐藏状态,并将它们输入声学解码器以预测目标梅尔频谱图。在推理过程中,我们选择最可能的路径并将该路径上的隐藏状态作为声学解码器的输入。在 CVSS Fr → En 基准上的实验表明,DASpeech 可以实现与最先进的 S2ST 模型 Translatotron 2 相当甚至更好的性能,同时与自回归基线相比保持高达 18.53 倍的加速。与之前的非自回归 S2ST 模型相比,DASpeech 不依赖于知识蒸馏和迭代解码,在翻译质量和解码速度方面都实现了显着提升。此外,DASpeech 还展示了在翻译过程中保留源语音的说话者声音的能力。23
在过去的几十年里,航天/航空航天飞行器的先进制导与控制 (G&C) 系统的设计受到了全世界的广泛关注,并将继续成为航空航天工业的主要关注点。毫不奇怪,由于存在各种模型不确定性和环境干扰,基于鲁棒和随机控制的方法在 G&C 系统设计中发挥了关键作用,并且已经成功构建了许多有效的算法来制导和操纵航天/航空航天飞行器的运动。除了这些面向稳定性理论的技术外,近年来,我们还看到一种日益增长的趋势,即设计基于优化理论和人工智能 (AI) 的航天/航空航天飞行器控制器,以满足对更好系统性能日益增长的需求。相关研究表明,这些新开发的策略可以从应用的角度带来许多好处,它们可以被视为驱动机载决策系统。本文系统地介绍了能够为航天/航空航天飞行器生成可靠制导和控制命令的最先进的算法。本文首先简要概述了航天/航空航天飞行器的制导和控制问题。随后,讨论了有关基于稳定性理论的 G&C 方法的大量学术著作。回顾并讨论了这些方法中固有的一些潜在问题和挑战。然后,概述了各种最近开发的基于优化理论的方法,这些方法能够产生最佳制导和控制命令,包括基于动态规划的方法、基于模型预测控制的方法和其他增强版本。还讨论了应用这些方法的关键方面,例如它们的主要优势和固有挑战。随后,特别关注最近探索 AI 技术在飞行器系统最佳控制方面的可能用途的尝试。讨论的重点说明了航天/航空航天飞行器控制问题如何从这些 AI 模型中受益。最后,总结了一些实际实施考虑因素以及一些未来的研究主题。
摘要背景:生物信息学工作流程经常使用自动基因组组装和蛋白质聚类工具。在大多数这些工具的核心中,执行时间的很大一部分用于确定两个序列之间的最佳局部比对。此任务使用 Smith-Waterman 算法执行,这是一种基于动态规划的方法。随着现代测序技术的出现以及基因组和蛋白质数据库的规模不断扩大,对更快的 Smith-Waterman 实现的需求应运而生。CPU 提供了多种 Smith-Waterman 算法的 SIMD 策略。然而,随着 HPC 设施向基于加速器的架构的转变,对高效的 GPU 加速策略的需求也随之而来。现有的基于 GPU 的策略要么针对特定类型的字符(核苷酸或氨基酸)进行了优化,要么仅针对少数应用用例进行了优化。结果:在本文中,我们提出了一种新的 GPU 架构序列比对策略 ADEPT,它与领域无关,支持来自基因组和蛋白质的序列比对。我们提出的策略使用 GPU 特定的优化,不依赖于序列的性质。我们通过实施 Smith-Waterman 算法并将其与类似的 CPU 策略以及每个领域中已知的最快 GPU 方法进行比较,证明了该策略的可行性。ADEPT 的驱动程序使其能够跨多个 GPU 进行扩展,并可以轻松集成到利用大规模计算系统的软件管道中。我们已经证明,基于 ADEPT 的 Smith-Waterman 算法在 Cori 超级计算机的单个 GPU 节点(8 个 GPU)上分别针对基于蛋白质和基于 DNA 的数据集展示了 360 GCUPS 和 497 GCUP 的峰值性能。总体而言,与相应的 SIMD CPU 实现相比,ADEPT 在节点到节点的比较中显示出 10 倍更快的性能。结论:ADEPT 表现出相当或更好的性能(下页继续)
人们相信量子信息科学将引发下一次技术革命。量子网络是量子信息科学的关键要素,它使各种技术成为可能,例如安全通信、分布式量子传感、量子云计算以及下一代定位、导航和授时。量子网络的主要任务是实现网络中不同节点之间的量子通信。这包括涉及多方的量子态传输、端节点的量子信息处理以及远程节点之间的纠缠分布等主题。由于量子通信具有其独特的特性,而这些特性在经典通信网络中是没有的,因此为经典通信网络设计的协议和策略并不适用于量子通信。这就需要为量子网络量身定制的新概念、范例和方法。为此,本论文研究了量子网络的设计和操作,重点关注以下三个主题:状态传输、排队延迟和远程纠缠分布。第一部分开发了将量子态从发射器广播到 N 个不同接收器的协议。该协议表现出多方纠缠、广播经典比特(bcbits)和广播量子比特(bqubits)之间的资源权衡,其中后两者是本论文提出的新型资源。我们证明,要使用共享纠缠将 1 bqubit 发送到 N 个接收者,O(log N)bcbits 是必要和充分的。我们还表明,可以使用由单量子比特门和 CNOT 门组成的多(N)个基本门来实现协议。第二部分介绍了一种用于分析量子数据排队延迟的可处理模型,称为量子排队延迟(QQD)。该模型采用动态规划形式,并考虑了有限内存大小等实际方面。利用该模型,我们开发了一种基于认知内存的内存管理策略,并表明该策略可以使平均排队延迟随着内存大小呈指数级下降。第三部分提出了一种远程纠缠分布 (RED) 协议的设计,以最大化纠缠分布率 (EDR)。我们引入了以下概念
数字逻辑:逻辑函数、最小化、组合和顺序电路的设计和综合;数字表示和计算机算术(定点和浮点)。计算机组织和架构:机器指令和寻址模式、ALU 和数据路径、CPU 控制设计、内存接口、I/O 接口(中断和 DMA 模式)、指令流水线、缓存和主内存、二级存储。编程和数据结构:C 语言编程;函数、递归、参数传递、范围、绑定;抽象数据类型、数组、堆栈、队列、链接列表、树、二叉搜索树、二叉堆。算法:分析、渐近符号、空间和时间复杂度概念、最坏和平均情况分析;设计:贪婪方法、动态规划、分而治之;树和图遍历、连通分量、生成树、最短路径;散列、排序、搜索。时间和空间的渐近分析(最佳、最坏、平均情况)、上限和下限、复杂性类 P、NP、NP-hard、NP-complete 的基本概念。计算理论:正则语言和有限自动机、上下文无关语言和下推自动机、递归可枚举集和图灵机、不可判定性。编译器设计:词汇分析、解析、语法制导翻译、运行时环境、中间和目标代码生成、代码优化基础。操作系统:进程、线程、进程间通信、并发、同步、死锁、CPU 调度、内存管理和虚拟内存、文件系统、I/O 系统、保护和安全。数据库:ER 模型、关系模型(关系代数、元组演算)、数据库设计(完整性约束、范式)、查询语言(SQL)、文件结构(顺序文件、索引、B 和 B+ 树)、事务和并发控制。信息系统和软件工程:信息收集、需求和可行性分析、数据流图、流程规范、输入/输出设计、流程生命周期、项目规划和管理、设计、编码、测试、实施、维护。计算机网络:ISO/OSI 堆栈、LAN 技术(以太网、令牌环)、流量和错误控制技术、路由算法、拥塞控制、TCP/UDP 和套接字、IP(v4)、应用层协议(icmp、dns、smtp、pop、ftp、http);集线器、交换机、网关和路由器的基本概念。网络安全基本概念:公钥和私钥加密、数字签名、防火墙。Web 技术:HTML、XML、客户端-服务器计算的基本概念。
存在金融危机),但这种偏差对于降低金融脆弱性来说是最佳的。在均衡状态下,央行有时触发衰退来降低系统性脆弱性是最佳的。简而言之,我们表明,用前美联储主席威廉·麦克切斯尼·马丁 (William McChesney Martin) 的话来说,央行“拿走潘趣酒碗”可能是最佳选择。马丁指的是控制经济以限制通货膨胀。该模型的设定(详见下文第 2 节)是抵押品在经济中发挥真正作用的模型。美国国债是一种抵押品。国债具有便利收益率,例如,参见 Krishnamurthy 和 Vissing-Jorgensen (2012)。“便利收益率”是由于国债具有安全属性而获得的非金钱回报,即它们在到期时很有可能按面值支付。私营部门无法生产无风险债务,但可以生产相近的替代品,高评级的抵押贷款支持证券 (MBS) 就是最典型的例子。参见 Caballero 等人(2017 年)。这一点很重要,因为从来没有足够的国债来满足对安全资产的需求。参见 Gorton 等人(2012 年)。这里的“宏观审慎政策”是指对经济中抵押品质量的最佳管理,即 MBS 与国债的比率。金融脆弱性(即发生危机的可能性)在这个比率中不断增加,从而降低了福利。在批发银行体系即当前的金融部门中,MBS 和国债用于支持回购、货币市场基金和抵押贷款支持商业票据,即作为危机根源的短期债务。在这里,央行不是直接监管短期债务的数量,而是通过抵押品质量进行间接监管。这是很自然的,因为公开市场操作已经在用现金换取国债,反之亦然。1 因此,无论央行是否认识到这一点,它实际上都在影响经济中抵押品的质量。在这里,央行明确地承认了这一点。在移动抵押品的世界中,宏观审慎问题会干扰货币政策。我们分析的模型是一个大参与者(央行)与许多小参与者(私营经济中的代理人)之间的无限重复博弈。这是一个拉姆齐问题,其中央行无法承诺其最优政策。由于 Kydland 和 Prescott(1977)和 Calvo(1978)的结果表明动态规划由于动态不一致性不能用作解决方法,此类设置已成为大量研究的主题。然而,Fudenberg 等人首次定义的完全公共均衡 (PPE) 的递归表征。 (1994 年),Abreu 等人(1986 年)提出了动态博弈的 APS 模型。APS 阐明了这个问题。在任何 PPE 中,大玩家的策略都是动态一致的,尽管没有承诺。此外,在玩家数量有限的博弈中,APS表明过去的历史可以通过承诺的未来效用、延续价值来总结,并且可以递归地描述代理的价值。这种方法在宏观经济学中得到了广泛的应用。2
实践中,需要大规模量子计算机来以更高的速度解决复杂问题,但在实现上存在一些问题,如量子退相干。其原因是量子比特与环境相互作用,从而对误差更敏感[10-12]。解决上述问题的一个合理方法是使用分布式量子计算机减少处理信息时使用的量子比特数量。分布式量子计算机可以由两个或多个具有较少量子比特的低容量量子计算机构建,类似于用于解决单个问题的量子系统网络中的分布式节点或子系统[13,14]。在这种结构中,需要量子(经典)通信协议来在单独的节点之间进行通信。分布式量子计算最早由 Grover [15]、Cleve 和 Buhrman [16] 以及 Cirac 等人 [17] 提出。随后,Ying和Feng [11]定义了一种描述分布式量子电路的代数语言。之后,Van Meter等[18]提出了分布式量子电路中的VBE进位波加法器结构。与此同时,该领域的一些工作集中在通信部分。2001年,Yepez [19]提出了两种类型的量子计算机。在第I类量子计算机中,量子通信用于互连分布式量子计算机的子系统。在II类量子计算机中,使用经典通信代替量子通信来互连分布式量子计算机的子系统或节点。在量子通信中,在网络节点之间传输量子比特的著名方法之一是量子隐形传态(QT)[20–23]。在隐形传态中,量子比特在两个用户或节点之间传输,而无需物理移动它们。然后,在量子比特上本地执行计算;这种方法也称为远程数据。还有一些工作侧重于优化分布式量子电路的通信成本。假设量子比特隐形传态是一种昂贵的资源,这类工作试图减少这种远程数据 [ 24 – 26 ]。在 [24 ] 中,作者考虑了具有公共控制或目标量子比特的连续 CNOT 门。他们表明,这样的结构只需一次隐形传态即可执行两个门。在 [25 ] 和 [26 ] 中,这个想法得到了扩展,并提出了一些算法来减少所需的隐形传态次数。考虑了所有可能导致通信减少的配置。[27 – 29 ] 还分别考虑了使用启发式方法、动态规划方法和进化算法来优化隐形传态次数。另一种方法称为远程门,当节点相距甚远时,它使用量子纠缠直接远程执行门。远程门方法的挑战之一是在位于分布式量子计算机不同节点的量子比特之间建立 n 量子比特控制量子门的最佳实现。根据所考虑的库(如 NCV、NCT、Clifford + T 等),可以使用不同的控制门来合成量子电路的变换矩阵。众所周知的可逆量子门之一是 Toffoli 门。Toffoli 门与 Hadamard 门一起构成了量子计算的通用集。此外,具有两个以上控制量子比特的多控制 Toffoli 门在量子计算中得到广泛应用。因此,实现在网络的不同节点之间应用 n 量子比特远程 Toffoli 门(受控非门)的协议至关重要。