主动推理是理解生物智能的贝叶斯框架。其基本理论将感知和行动归结为一个单一的命令:最小化自由能。然而,尽管它在解释智能方面具有理论效用,但计算实现却仅限于低维和理想化的情况。在本文中,我们提出了一种神经架构,用于构建在复杂、连续状态空间中运行的深度主动推理代理,使用多种形式的蒙特卡罗 (MC) 采样。为此,我们介绍了一些对主动推理来说新颖的技术。这些包括:i) 通过 MC 树搜索选择自由能量最优策略,ii) 通过前馈“习惯性”网络近似该最优策略分布,iii) 使用 MC 丢失预测未来参数信念更新,最后,iv) 优化状态转换精度(一种高端注意力形式)。我们的方法使代理能够有效地学习环境动态,同时与基于奖励的对应者相比保持任务性能。我们在基于 dSprites 数据集的新玩具环境中说明了这一点,并证明主动推理代理会自动创建适合建模状态转换的解开表示。在更复杂的 Animal-AI 环境中,我们的代理(使用相同的神经架构)能够模拟未来的状态转换和动作(即计划),以显示奖励导向的导航 - 尽管暂时停止了视觉输入。这些结果表明,配备 MC 方法的深度主动推理提供了一个灵活的框架来开发受生物启发的智能代理,可应用于机器学习和认知科学。
2 请注意,此处讨论的算法在概念上不同于用于分析量子多体系统的量子蒙特卡罗技术(Pang ( 2016 ))。3 其他方法包括量子搜索(如 Grover ( 1996 ) 中的方法)和相位估计(如 Kitaev ( 1995 ) 中的方法)。4 有关编码概率分布,请参阅 Grover 和 Rudolph ( 2002 )、Zoufal 等人 ( 2019 )、Herbert ( 2021a ),有关编码随机变量,请参阅 Rebentrost 等人 ( 2018 )、Vedral 等人 ( 1996 )、Herbert ( 2021b )、Woerner 和 Egger ( 2019 )、Stamatopoulos 等人 ( 2020a )。
近年来,机器学习、量子多体物理学和量子信息科学等领域的交流卓有成效。这种多学科的互动在一定程度上得益于以下发现:人工神经网络为参数化量子多体希尔伯特空间的子集提供了强大的归纳偏差。尽管通过神经网络描述希尔伯特空间向量会导致无法对此类量子态子集进行精确的线性代数运算,但由于存在一种名为变分蒙特卡洛 (VMC) 的有效随机近似算法 [8,30],基于神经网络的量子态 (NQS) 能够准确揭示量子自旋系统基态的属性,并使用 VMC 的时间相关变体(即所谓的 t-VMC)模拟其时间演化 [6,7]。自从复值受限玻尔兹曼机 [ 8 ] 问世以来,神经网络量子态的范围已经扩大到涵盖各种量子系统,这通过使用日益复杂(通常是多层的)的架构成为可能。相互作用的另一个驱动因素是发现 VMC 和变分量子算法 (VQA) 之间有着密切的类似性。特别是 Stokes 等人 [ 40 ] 在量子信息几何方面的最新研究阐明了机器学习中的自然梯度下降 [ 2 ]、随机重构 VMC [ 38 ] 和量子计算中的变分虚时间演化 [ 45 ] 之间的联系。本教程论文旨在作为对连续变量量子系统的基于流的 VMC 和 t-VMC 的独立回顾。为了具体起见,我们以玻色子量子系统为例进行讨论,以场振幅基表示。场振幅基并不是 VMC 文献 3 的传统焦点,VMC 文献集中于更易于用 Fock 基解释的非相对论系统。然而,场振幅基在具有相对论对称性的系统中是自然的,其中受控玻色子哈密顿量在 L 2 空间中表示为简单的薛定谔算子。因此,哈密顿量的简单性也提供了教学优势。场振幅基的一个可能的计算优势是,它不需要人为地将允许的模式占用数限制在有限范围内以进行数值实现。为了促进
随机过程在物理学、数学、工程学和金融学中起着基础性的作用。量子计算的一个潜在应用是更好地近似随机过程的性质。例如,用于蒙特卡罗估计的量子算法将随机过程的量子模拟与振幅估计相结合,以改进均值估计。在这项工作中,我们研究了与蒙特卡罗方法兼容的模拟随机过程的量子算法。我们引入了一种新的随机过程“模拟”量子表示,其中时间 t 时的过程值存储在量子态的振幅中,从而能够以指数方式高效编码过程轨迹。我们表明,这种表示允许使用高效量子算法来模拟某些随机过程,这些算法使用这些过程的光谱特性与量子傅里叶变换相结合。特别是,我们表明我们可以使用门复杂度为 polylog(T) 的量子电路来模拟分数布朗运动的 T 个时间步,该电路可以连贯地准备布朗路径上的叠加。然后,我们表明这可以与量子均值估计相结合,以创建端到端算法,用于估计时间 O (polylog(T)ϵ − c) 内过程的某些时间平均值,其中 3 / 2 < c < 2 是分数布朗运动的某些变体,而经典蒙特卡洛运行时间为 O (Tϵ − 2),量子均值估计时间为 O (Tϵ − 1)。在此过程中,我们给出了一种有效的算法,以相干方式加载具有不同方差的高斯振幅的量子态,这可能是独立的兴趣所在。
过去几年,陆军航空事故不断增加,这主要是由于任务频率和复杂性增加以及资源减少。由此造成的损失(人员伤亡、金钱、设备)的严重性促使陆军安全中心指挥官要求全面审查安全隐患和后续安全控制的评估和选择方式。该项目通过开发和使用有效识别和评估控制组合的方法,将价值导向思维、蒙特卡罗模拟和整数规划相结合,以满足这一需求。整数规划生成控制组合,以最大程度地减少导致陆军航空事故的危险。使用引导方法的蒙特卡罗模拟用于模拟 100,000 个 UH-60 飞行小时内发生的事故造成的损失数量和类型。已经开发了一个价值模型来量化这些损失的严重程度。控制组合的预期绩效计算为实施这些控制措施所导致的损失严重程度的预期下降。
过去几年,陆军航空事故不断增加,这主要是由于任务频率和复杂性增加以及资源减少。由此造成的损失(人员伤亡、金钱、设备)的严重性促使陆军安全中心指挥官要求全面审查安全隐患和后续安全控制的评估和选择方式。该项目通过开发和使用有效识别和评估控制组合的方法,将价值导向思维、蒙特卡罗模拟和整数规划相结合,以满足这一需求。整数规划生成控制组合,以最大程度地减少导致陆军航空事故的危险。使用引导方法的蒙特卡罗模拟用于模拟 100,000 个 UH-60 飞行小时内发生的事故造成的损失数量和类型。已经开发了一个价值模型来量化这些损失的严重程度。控制组合的预期绩效计算为实施这些控制措施所导致的损失严重程度的预期下降。
扩展卡尔曼滤波器或高斯和滤波器等近似方案可能不可靠,而确定性积分方法难以实现。SMC 方法,也称为粒子方法,是一类基于顺序模拟的算法,用于近似感兴趣的后验分布。它们之所以广受欢迎,是因为它们易于实现,适合并行实现,更重要的是,已在多种环境中证明能比刚才提到的标准替代方案产生更准确的估计 [14, 17, 35]。本文的主要目的是讨论参数 θ 未知且需要以在线或离线方式从数据中估计的情况。我们假设观测值由参数值为 θ ∗ 的未知“真实”模型生成,即 X n | ( X n − 1 = xn − 1 ) ∼ f θ ∗ ( ·| xn − 1 ) 和 Y n | ( X n = xn ) ∼ g θ ∗ ( ·| xn )。静态参数估计问题在过去几年中引起了广泛关注,并且已提出许多 SMC 技术来解决该问题。在这篇评论中,我们试图深入了解这项任务的难度,并全面概述该主题的文献。我们将介绍每种方法的主要特点并评论它们的优缺点。但是,我们不会尝试讨论具体实现的复杂性。为此,我们请读者参阅原始参考文献。我们选择将这些方法大致分为以下几类:
高精度地解决分子和固体的电子结构问题是量子化学和凝聚态物理学中的一大挑战。量子计算机的迅速出现和发展为系统地解决这一问题提供了一条有希望的途径。最近的研究[Huggins 等人,Nature (London) 603, 416 (2022)]提出了一种混合量子-经典量子蒙特卡罗 (QC-QMC) 算法,使用 Clifford 阴影来确定费米子哈密顿量的基态。与纯经典方法相比,这种方法表现出固有的噪声弹性和提高精度的潜力。然而,使用 Clifford 阴影会带来指数级增长的后处理成本。在这项工作中,我们研究了一种改进的 QC-QMC 方案,该方案利用最近开发的 Matchgate 阴影技术 [Commun. Math. Phys. 404, 629 (2023)],消除了前面提到的指数瓶颈。我们从量子硬件上的实验中观察到,在 QC-QMC 中使用 Matchgate 阴影本质上具有抗噪性。我们表明,这种抗噪性比 Clifford 阴影的情况有更微妙的起源。然而,我们发现经典后处理虽然渐近高效,但即使是最小的化学系统也需要在数千个经典 CPU 上运行数小时,这对算法的可扩展性提出了重大挑战。
我们利用先进的数值技术处理基于动力学蒙特卡罗技术的实验测量和模拟,分析了电阻存储器 (RRAM) 中的可变性。研究中使用的设备是使用 TiN/Ti/HfO 2 /W 堆栈制造的。利用新开发的提取方法获得了开关参数。通过与动力学蒙特卡罗模拟进行比较,检查了高级参数提取方法的适用性;特别是,研究和检测了复位和设置事件。获得的数据用于阐明电阻开关操作和周期间可变性。结果表明,可变性取决于用于获得设置和复位电压的数值技术,因此,在 RS 特性和建模研究中必须考虑到这个问题。所提出的技术是互补的,并且根据技术和曲线形状,特定方法的特征可以使其成为最合适的方法。
Savvakis C. Savvides 曾任塞浦路斯开发银行高级经理兼扭亏为盈部门主管。此前,他曾担任项目融资和结构性融资部门主管。他还曾担任该银行旅游和服务贷款组合主管。他曾担任哈佛大学和加拿大皇后大学投资评估和管理项目的客座讲师。他是投资评估、风险分析以及营销和商业战略在项目评估中的应用方面的多部出版物的作者。他还是 RiskMaster 和 RiskEase 等软件程序的开发者,这些程序被广泛用于项目评估中的风险评估。