•MDP空间中V ∗和Q ∗的Lipschitz连续性的理论研究; •根据MDP之间的局部距离提出的实用,非负转移方法; •在终身RL设置中应用此转移方法的PAC-MDP算法的建议和研究。
数据敏感度量自然出现在机器学习中,并且在一些著名方法中起着核心作用,例如 k-NN 图方法、流形学习、水平集方法、单链接聚类和基于欧氏 MST 的聚类(详情见第 5 节和附录 A)。构建合适的数据敏感度量是一个活跃的研究领域。我们考虑一个简单的数据敏感度量,它有一个底层流形结构,称为最近邻度量。该度量最早在 [CFM + 15] 中引入。它及其近似变体在过去已被多位研究人员研究过 [HDHI16、CFM + 15、SO05、BRS11、VB03]。在本文中,我们展示了如何精确计算任意维度的最近邻度量,这解决了任何基于流形的度量最重要和最具挑战性的问题之一。
最终,如果在X决赛中。 如果F是Lipschitz,那时X最终如果F在X Final处局部Lipschitz,最终,如果在X决赛中。如果F是Lipschitz,那时X最终如果F在X Final处局部Lipschitz,
几项研究试图解决非线性非自治动力学系统的观察者设计问题[2,4,6,8,10,13,18]。在文献中,最涉及的非线性系统是所谓的Lipschitz类系统。在这方面,[17]建立了足够的条件,确保了Lipschitz系统的观察者的稳定性。实践中,Lipschitz系统构成了重要的实际系统,这激发了越来越多的Lipschitz系统观察者的关注。但是,许多现有结果仅适用于小的Lipschitz常数。因此,数学文献[11]为广义Lipschitz的连续性构建了单面Lipschitz的连续性。在同一概念[1]中,对于非线性系统,二次内在性是
摘要 - 我们提出了订单1的Wasserstein距离与N Qudits的量子状态的概括。该提案在规范基础的向量中恢复了锤距,更通常是在规范的基础上,量子状态的经典瓦斯坦距离。相对于作用于一个Qudit的Qudits和单一操作的排列,所提出的距离是不变的,并且相对于张量产品是加法的。我们的主要结果是相对于所提出的距离,冯·诺伊曼熵的连续性结合,这显着增强了相对于痕量距离的最佳连续性。我们还提出了将Lipschitz常数的概括为量子可观察到的。量子Lipschitz常数的概念使我们能够使用半限定程序来计算提出的距离。我们证明了Marton的运输不平等的量子版本和量子Lipschitz可观察到的量子的量子高斯浓度不平等。此外,我们在浅量子电路的收缩系数以及相对于所提出的距离方面的张量量量的张量。我们讨论了量子机学习,量子香农理论和量子多体系统中的其他可能应用。
摘要 — 我们提出了将 1 阶 Wasserstein 距离推广到 n 个量子态的建议。该建议恢复了正则基向量的汉明距离,更一般地恢复了正则基中对角量子态的经典 Wasserstein 距离。所提出的距离对于作用于一个量子态的量子位元的排列和幺正运算是不变的,并且对于张量积是可加的。我们的主要结果是冯·诺依曼熵关于所提距离的连续性界限,这显著加强了关于迹距离的最佳连续性界限。我们还提出了将 Lipschitz 常数推广到量子可观测量的建议。量子 Lipschitz 常数的概念使我们能够使用半定程序计算所提出的距离。我们证明了 Marton 传输不等式的量子版本和量子 Lipschitz 可观测量谱的量子高斯浓度不等式。此外,我们推导出浅量子电路的收缩系数和单量子信道的张量积相对于所提出的距离的界限。我们讨论了量子机器学习、量子香农理论和量子多体系统中的其他可能应用。
在线学习中的有效探索(AAAI 最佳论文亚军、IJCAI)行星健康问题通常是空间规划问题,其中每个动作都是特定于上下文的,对应于地球上的物理区域。与每个动作相关的地理特征使我们能够使用平滑度假设来关联动作。例如在野生动物保护中,我们预计具有相似地理特征的地区也会有相似的偷猎模式。从数学上讲,我们可以将两个动作的奖励中的这种相似性编码为 Lipschitz 连续性。此外,每个动作(巡逻一组区域)在区域数量上是组合的,但可以分成具有附加、可分解奖励的构成区域。因此,我们引入了一种新的多臂老虎机变体,该变体结合了可分解性和平滑性,在这些奖励估计上强制实施 Lipschitz 连续性假设,以实现明显更快的收敛 [3]。我们表明,这种方法可以改善遗憾界限,并且不依赖于区域数量 N ,与最先进的 ˜ O ( T
摘要。控制工程中的重复和重要任务是在约束下进行调整,从概念上讲,仅通过噪声评估才能访问黑框函数。例如,在预设司法机构的控制练习参数中,通常会用工厂的反馈在线调整,并且只能尝试使用安全的Pa-Rameter值,例如不稳定。最近,已经针对这种重要的概率部署了机器学习方法,尤其是贝叶斯优化(BO)。为处理安全性,安全BO的算法,尤其是SafeOpt-type算法,这些算法在基于学习的控制,机器人技术和相邻领域方面享有很大知名度。但是,我们确定了实践安全的两个重要障碍。首先,SafeOPT型算法依赖于标志性的不确定性界限,大多数实现将这些算法替换为理论上不支持的启发式方法。第二,理论上有效的非确定性界限至关重要地取决于数量 - 目标函数的繁殖内核希尔伯特空间规范 - 目前无法使用已建立的先验工程知识可靠地绑定它。通过仔细的数值实验,我们表明这些问题确实会导致安全违规。为了克服这些问题,我们提出了Lipschitz仅安全的贝叶斯优化(LOSBO),这是一种仅依赖于已知Lipschitz为其安全而绑定的安全的BO算法。此外,我们提出了一个避免搜索空间网格的变体(LOS-GP-UCB),因此即使适用于适度的高维问题。
b“摘要。在本文中,我们开发了一些新技术来以\ xe2 \ x88 \ x92 div a \ xb5 \ xb5 \ x88 \ x88 \ x87 \ x87 u \ xce \ xb5 = 0的形式研究多尺度椭圆方程\ xc2 \ xb7 \ xc2 \ xb7 \ xc2 \ xb7,x/\ xce \ xb5 n)是N-尺度振荡的周期性coe \ xef \ xac \ xac \ x83cient matrix和( \ xe2 \ x89 \ xa4 n是比例参数。We show that the C \xce\xb1 -H\xc2\xa8older continuity with any \xce\xb1 \xe2\x88\x88 (0 , 1) for the weak solutions is stable, namely, the constant in the estimate is uniform for arbitrary ( \xce\xb5 1 , \xce\xb5 2 , \ xc2 \ xb7 \ xc2 \ xb7 \ xc2 \ xb7,\ xce \ xb5 n)\ xe2 \ x88 \ x88 \ x88 \ x88(0,1] n,尤其与\ xce \ xb5i's。s。证明使用了升级的合并方法,涉及h-Convergence的比例还原定理。lipschitz估计任意(\ xce \ xb5 i)1 \ xe2 \ x89 \ xa4 i \ xe2 \ x89 \ xa4 n仍然保持开放。但是,对于特殊的层压结构,即A \ XCE \ XB5(x)= a(x,x,x,x 1 /\ xce \ xb5 1,\ xc2 \ xb7 \ xc2 \ xc2 \ xc2 \ xb7 \ xc2 \ xc2 \ xc2 \ xc2 \ xb7 \ xce \ xb5 1,\ xce \ xb5 2,\ xc2 \ xb7 \ xc2 \ xb7 \ xc2 \ xc2 \ xb7,\ xce \ xb5 n)\ xe2 \ xe2 \ x88 \ x88 \ x88 \ x88(0,1]这是通过一种重复化技术证明的。”
深层神经网络(DNNS)在众多领域取得了巨大的成功,并且它们在与PDE相关的问题上的应用正在迅速发展。本文使用DNN将学习Lipschitz操作员在Banach空间上使用DNN的概括错误提供了估计,并将其应用于各种PDE解决方案操作员。目标是指定DNN宽度,深度以及保证某个测试错误所需的训练样本数量。在对数据分布或操作员结构的轻度假设下,我们的分析表明,深层操作员学习可以放松地依赖PDE的离散化解决方案,从而减少许多与PDE相关的问题的诅咒,包括椭圆方程,抛物线方程,抛物线方程和汉堡方程。我们的结果还适用于在操作员学习中有关离散化侵权的见解。