循环神经网络已被证明可在为推荐系统建模顺序用户反馈方面发挥有效作用。然而,它们通常仅关注项目相关性,无法有效地为用户探索多样化的项目,因此从长远来看会损害系统性能。为了解决这个问题,我们提出了一种新型的循环神经网络,称为循环探索网络 (REN),以联合执行表示学习和潜在空间中的有效探索。REN 试图在相关性和探索之间取得平衡,同时考虑到表示中的不确定性。我们的理论分析表明,即使学习到的表示存在不确定性,REN 也可以保持速率最优的亚线性遗憾。我们的实证研究表明,REN 可以在合成和现实世界的推荐数据集上获得令人满意的长期回报,表现优于最先进的模型。
P I HE 维特比算法 (VA) 于 1967 年被提出作为卷积码解码的方法。从那时起,它就被认为是解决各种数字估计问题的有效方法,就像卡尔曼滤波器被应用于各种模拟估计问题一样。与卡尔曼滤波器一样,VA 使用递归方法跟踪随机过程的状态,该方法在某种意义上是最优的,并且易于实现和分析。然而,底层过程被假定为有限状态马尔可夫而不是高斯,这导致了结构上的显著差异。本文主要旨在对 VA、其结构和分析进行教程介绍。它还旨在或多或少详尽地回顾截至本文撰写时(1972 年夏季)所有受该算法启发或与该算法相关的工作。我们相信该算法将在越来越多的领域得到应用。我们希望能够为本文的读者加速这一进程。
我们探讨消费异质性如何影响货币冲击的国际传导机制以及开放经济中最优货币政策的选择。将两种类型的主体(李嘉图主义和凯恩斯主义)纳入标准开放经济宏观模型,我们发现,在相当大的家庭异质性范围内,货币政策变得无效,但这敏感地取决于总需求和相对价格效应的相互作用。我们推导出替代定价制度下具有家庭异质性的全球最优货币政策。在PCP下,PPI目标仍然是最优货币政策,可以使经济恢复到有效均衡。然而,在LCP下,消费异质性和货币错位的存在意味着CPI通胀目标在大多数情况下不再是最优的。最后,我们表明,当引入进口税和出口补贴等财政手段时,货币错位和消费异质性都可以消除,即使在LCP下,PPI目标也是最优货币规则。
摘要 — 我们介绍了 QFAST,这是一种量子合成工具,旨在产生短路并在实践中很好地扩展。我们的贡献是:1)一种能够对位置和拓扑进行编码的新型电路表示;2)一种具有迭代细化公式的分层方法,该方法将电路结构搜索期间的“粗粒度”快速优化与仅在最终电路实例化阶段进行的良好但较慢的优化阶段相结合。与最先进的技术相比,尽管 QFAST 不是最优的,但它可以为领域科学家使用的“时间相关演化”算法生成更短的电路。我们还展示了我们的公式在电路深度和运行时间方面的可组合性和可调谐性。例如,我们展示了如何通过在给定的层次结构级别插入最佳可用的第三方合成算法来生成更短的电路。可组合性实现了跨芯片架构的可移植性,这是现有方法所缺乏的。
在本技术报告中,我们为非物理学家提供了量子计算的基本介绍。在本介绍中,我们详细描述了一些基础量子算法,包括:Deutsch-Jozsa 算法、Shor 算法、Grocer 搜索和量子计数算法,并简要介绍了 Harrow-Lloyd 算法。此外,我们还介绍了 Solomonoffi 归纳法,这是一种理论上最优的预测方法。然后,我们尝试使用量子计算来寻找更好的算法来近似 Solomonoffi 归纳法。这是通过使用其他量子计算算法中的技术来实现的,以加速计算速度先验,这是 Solomonoffi 先验的近似值,是 Solomonoffi 归纳法的关键部分。主要的限制因素是计算的概率通常非常小,以至于如果没有足够(通常大量)的试验,误差可能会大于结果。如果可以通过量子计算大幅加快 Solomonoffiduction 近似计算的速度,那么它就可以应用于智能代理领域,作为代理 AIXI 近似的关键部分。
在本技术报告中,我们为非物理学家提供了量子计算的基本介绍。在本介绍中,我们详细描述了一些基础量子算法,包括:Deutsch-Jozsa 算法、Shor 算法、Grocer 搜索和量子计数算法,并简要介绍了 Harrow-Lloyd 算法。此外,我们还介绍了 Solomonoffi 归纳法,这是一种理论上最优的预测方法。然后,我们尝试使用量子计算来寻找更好的算法来近似 Solomonoffi 归纳法。这是通过使用其他量子计算算法中的技术来实现的,以加速计算速度先验,这是 Solomonoffi 先验的近似值,是 Solomonoffi 归纳法的关键部分。主要的限制因素是计算的概率通常非常小,以至于如果没有足够(通常大量)的试验,误差可能会大于结果。如果可以通过量子计算大幅加快 Solomonoffiduction 近似计算的速度,那么它就可以应用于智能代理领域,作为代理 AIXI 近似的关键部分。
摘要 — 多重模式布局分解 (MPLD) 已被广泛研究,但到目前为止,还没有一个分解器在结果质量和效率方面胜过其他分解器。这一观察促使我们探索如何为给定的布局图自适应地选择最合适的 MPLD 策略,这是一个并非平凡且仍未解决的问题。在本文中,我们提出了一种基于图卷积网络的布局分解框架来获得布局的图嵌入。图嵌入用于图库构建、分解器选择、图匹配、针迹去除预测和图着色。此外,我们设计了一种纯粹依赖于消息传递图神经网络的快速非针迹布局分解算法。实验结果表明,与快速但非最优的启发式方法相比,我们基于图嵌入的框架可以在广泛使用的基准中实现最佳分解,并且运行时间显着下降。
摘要:化工厂的盈利能力与其可靠性直接相关,可靠性一直是化学工业关注的重点。本文解决空气分离装置概念设计阶段的问题,以尽量减少负收入,其中包括管道供应中断造成的损失以及提高可靠性的成本,包括拥有冗余单元和储罐。提出了一种基于马尔可夫链假设的混合整数线性规划 (MILP) 模型 (表示为 RST),并将其应用于空气分离装置的激励示例。此外,为了解决更大的上层结构,我们提出了一种博弈论算法,该算法将问题分解和重构为各个处理阶段的团队博弈,并在它们之间达到纳什均衡。结果还表明,可以轻松获得接近全局最优的良好初始化点,从而保证纳什均衡解的质量。通过大量示例说明,所提算法能够以比原始 MILP 模型 (RST) 的直接解决方案更短的时间解决全局最优问题。
无限层 (IL) 镍酸盐为解决非常规超导领域的突出问题提供了一条超越氧化铜的新途径。然而,它们的合成面临着巨大的挑战,在很大程度上阻碍了这类新型氧化物超导体的实验研究。该合成过程分为两步:首先生成热力学最稳定的钙钛矿相,然后通过拓扑还原生成 IL 相,其中起始相的质量起着至关重要的作用。本文报道了一种可靠的超导 IL 镍酸盐薄膜合成方法,该方法是在对母体钙钛矿相进行连续拓扑化学还原后,以接近最优的化学计量比合成超导 IL 镍酸盐薄膜。仔细分析未完全还原薄膜的输运特性,发现在随后的拓扑化学还原过程中,其正常态电阻率的奇异金属行为有所改善,从而为还原过程提供了新的见解。
摘要:针对无人战斗机空战中的机动决策问题,本文提出了一种基于深度强化学习的无人战斗机自主机动决策方法。首先,建立敌我双方无人战斗机飞行机动模型及机动库。然后,考虑到无人战斗机俯仰角不同时各动作不同的状态转换效果,将俯仰角等10个状态变量作为状态空间。结合空战态势威胁评估指数模型,设计内部奖励与稀疏奖励相结合的两层奖励机制作为强化学习的评估依据。然后,根据异步优势演员-评论家(A3C)算法,构建全连接层的神经网络模型。通过多线程的方式,UCAV与环境不断交互学习,对模型进行训练,逐步学习到最优的空战机动对抗策略,并指导UCAV进行行动选择。该算法通过多线程异步学习,降低了样本间的相关性。最后,在三种不同的空战场景中验证了该方法的有效性和可行性。