摘要 - 在这项工作中,我们研究了通过边缘计算启用的流量计算的能量计算的问题。在考虑的情况下,多个用户同时竞争有限的无线电和边缘计算资源,以在延迟约束下处理经过处理的流量任务,并有可能利用所有网络节点的低功率睡眠模式。无线电资源分配考虑了细胞间和细胞内干扰,并且必须共同优化无线电和计算设备的职责周期,以最大程度地减少整体能源消耗。为了解决这个问题,我们将基本问题提出为动态的长期优化。然后,基于Lyapunov随机优化工具,我们将该法式问题与CPU调度问题和无线电资源分配问题分配为每插槽。虽然第一个可以使用快速迭代算法来最佳且有效地解决,但第二个可以使用分布式的多代理增强式学习来解决第二个算法,因为其非凸性和NP固定度。所得框架最多可实现96。基于详尽搜索的最佳策略的5%性能,同时大大降低了复杂性。与基准启发式方法相比,提出的解决方案还允许提高网络的能量效率。
摘要 - 执行器故障可能会危害控制系统的性能和闭环稳定性。执行器与适当控制定律结合使用可以提高系统对效率丧失或障碍的弹性。被动故障控制(FTC)系统旨在设计独特的控制定律,并在名义和故障场景中保证稳定性。在这项工作中,一种新型基于机器学习的方法是为由执行器故障影响的系统系统合成控制法的,同时正式认证闭环稳定性的。学习体系结构训练两个人工神经网络,一个代表控制定律,另一个类似于控制Lyapunov功能(CLF)。同时,使用满意度模型理论求解器来证明所获得的CLF正式保证Lyapunov条件。该方法用于两种情况,一种涵盖了具有冗余执行器的倒摆的稳定,而另一种则涵盖了自主水下车辆的控制。该框架显示能够通过最小的高参数调整以及有限的计算资源来合成线性和非线性控制定律。
抽象 - 装备自主机器人,能够在人类周围安全有效地导航的能力是迈向实现可信赖的机器人自治的关键一步。但是,在确保动态多机构环境中的安全性的同时生成机器人计划仍然是一个关键挑战。基于最新的工作,以利用深层生成模型在静态环境中进行机器人计划,本文提出了Cobl-Diffusion,这是一种基于扩散的新型安全机器人计划器,用于动态环境。COBL扩散使用控制屏障和Lyapunov函数来指导扩散模型的固定过程,迭代地完善了机器人控制序列以满足安全性和稳定性约束。我们使用两个设置证明了COBL扩散的有效性:合成单位环境和现实世界中的行人数据集。我们的结果表明,COBL扩散会产生平滑的轨迹,使机器人能够到达目标位置,同时保持低碰撞速率,并具有动态障碍。
在本文中,在存在干扰,静止和移动的障碍物的情况下,考虑了四摩托无人机(UAV)的安全自动运动控制。在这方面,我们直接将一种分析控制设计方法(在后台框架内)结合在一起,并避免了解决导航问题的障碍。将屏障Lyapunov功能(BLF)纳入了翻译控制中,以使车辆远离安全球,并在障碍物周围构建,同时将其转向所需的位置。BLF允许将障碍物位置直接包含在控制设计中。这是针对已知和未知障碍速度的情况而实现的。此外,在分析中解决了任意初始条件的问题,并从安全领域进行了预先分配的时间。我们还考虑了避免机会约束碰撞的情况。所提出的方法导致了计算上有效的设计,因为获得了控制的封闭形式,而无需实时优化。更重要的是,可以保证闭环系统的分析稳定性。在存在干扰的情况下,设计了一个层次控制结构,具有无适应性模型控制,用于未知态度动力学。进行了许多数值模拟,以评估所提出方法的有效性。
• 李雅普诺夫稳定性、渐近稳定性、指数稳定性 • 李雅普诺夫稳定性定理 • 李雅普诺夫函数构造 • Krasovskii 方法、变量梯度法、Zubov 方法 • 线性系统稳定性和李雅普诺夫线性化方法 • 不变性原理 • 不变集稳定性定理 • 逆李雅普诺夫定理 • 不稳定性定理 • 部分稳定性 • 时变系统的稳定性理论 • 拉格朗日稳定性、有界性和最终有界性 • 庞加莱映射和周期轨道稳定性
这项研究研究了Lyapunov的传播,吸收和结构障碍之间的动态关系,以利用光子晶体中的定位现象。我们研究系统的系统,其中一个双层引入障碍的重分索引的随机变化,而缺陷层具有与λ型原子的不均匀掺杂,并且可以使有效的折射指数的相干调节。相干控制允许在无序方案中积极调整吸收,Lyapunov指数和定位特征。在吸收和lyapunov spec中,对于带隙和带缘频率观察到了显着的对比,突出了不同的定位行为。这些发现提高了对无序系统中光 - 物质相互作用和现场定位的理解,为定制的光子设备提供了途径。
摘要 - 该论文研究了一个无人驾驶汽车(UAV)辅助语义网络,地面用户(GUS)通过无人机的继电器定期将传感信息定期捕获到基站(BS)。GUS和UAV都可以从大型原始数据中提取语义信息,并将其传输到BS以恢复。较小尺寸的语义信息可降低延迟并改善信息新鲜度,而较大尺寸的语义信息可以在BS上进行更准确的数据重建,从而保留原始信息的价值。我们引入了一种新颖的语义感知年龄(SAOI)度量,以捕获信息的新鲜度和语义重要性,然后通过共同优化UAV-GU关联,语义提取,以及UAV的轨迹来提出时间平均的SAOI最小化问题。我们通过Lyapunov框架将原始问题分解为一系列子问题,然后使用层次深度强化学习(DRL)来解决每个子问题。具体来说,UAV-GU关联由DRL确定,然后是更新语义提取策略和无人机部署的优化模块。仿真结果表明,层次结构提高了学习效率。此外,它通过语义提取可实现较低的AOI,同时确保最小的原始信息丢失,表现优于现有基准。
课程描述:一阶标量微分方程。初始价值问题。存在,独特性,对初始数据的持续依赖。线性系统具有恒定系数。 指数矩阵。 线性和几乎线性系统的渐近行为。 二维自主系统。 关键点及其分类。 相平面分析。 Lyapunov稳定理论的简介。线性系统具有恒定系数。指数矩阵。线性和几乎线性系统的渐近行为。二维自主系统。关键点及其分类。相平面分析。Lyapunov稳定理论的简介。
神经网络在学习和控制方面表现出了巨大的力量,尤其是在学习动力学和预测动态系统的行为方面[1],[2]。在学习和控制社区近似动态行为时,尤其是稳定性和被动性时,就会有利于稳定性和被动性。执行稳定性可以使学习模型受益,尤其是在概括方面。对于非线性系统,在[3],[4],[5]中使用高斯混合模型和多个数字模型研究了学习过程中的稳定性,甚至在线性系统的情况下,它是非平凡的[6]。对于非线性系统,存在各种稳定概念,其影响不同。在学习的背景下,一个称为Contaction [7](任何一对轨迹相互收敛)的强稳定性概念最近由于其平衡 - 独立的稳定性性质而受到了很多关注。对于离散时间设置,[8],[9],[10]已经开发了收缩,逐渐被动和耗散性神经动力学。在[11]中可以找到连续的时间对应物。[9],[11]的好处是他们的直接(即稳定模型的参数化参数化,使培训变得容易。但是,一个限制是它们在国家独立的二次度量标准方面执行收缩,从而限制了灵活性。用于学习稳定性弱的动态系统(例如,Lyapunov稳定性W.R.T.特定的平衡)通常需要应用保留相似稳定性特性的模型。稳定神经差异方程的关键成分是神经Lyapunov功能。从[12]和佩雷尔曼(Perelman)[13]的庞加罗猜想分辨率,所有lyapunov函数均具有对单位球的同型集合。这建议搜索候选Lyapunov
Abstract In many real-world reinforcement learning (RL) problems, besides optimizing the main objective function, an agent must concurrently avoid violating a number of constraints.In particular, besides optimizing performance, it is crucial to guar- antee the safety of an agent during training as well as deployment (e.g., a robot should avoid taking actions - exploratory or not - which irrevocably harm its hard- ware).To incorporate safety in RL, we derive algorithms under the framework of constrained Markov decision processes (CMDPs), an extension of the standard Markov decision processes (MDPs) augmented with constraints on expected cu- mulative costs.Our approach hinges on a novel Lyapunov method.We define and present a method for constructing Lyapunov functions, which provide an ef- fective way to guarantee the global safety of a behavior policy during training via a set of local linear constraints.Leveraging these theoretical underpinnings, we show how to use the Lyapunov approach to systematically transform dynamic programming (DP) and RL algorithms into their safe counterparts.To illustrate their effectiveness, we evaluate these algorithms in several CMDP planning and decision-making tasks on a safety benchmark domain.Our results show that our proposed method significantly outperforms existing baselines in balancing con- straint satisfaction and performance.