摘要 - 连接和自动驾驶汽车(CAVS)预计可以减轻交通拥堵,尤其是在路交叉口,这是城市道路网络的主要瓶颈。本文提出了一种信号车辆耦合的最佳控制策略,用于骑士和人类驱动的车辆的混合交通流量。该方法遵循两层体系结构,该结构将信号车辆控制任务制定为两个通过混合排的概念串联的优化问题,以便中央协调员可以有效地解决它们。尤其是上层设计的,以最大程度地减少交叉路口中所有车辆的总等待时间,而下层则是通过充分利用信号计划,交叉车辆的数量以及在上层中获得的目标交叉速度来最大程度地减少汇总的车辆能量消耗。提供了广泛的仿真结果,以检查所提出的信号车辆关节控制框架的性能,并以不同的CAV穿透率,交通需求和电动汽车比率揭示新算法引入的影响。与现有方法的比较证明了在燃料使用和交通吞吐量方面提出的方法的好处。
摘要 - 这项研究是通过考虑一个新兴的实际问题来开始的,即DC微电网应在喂食电阻载荷和恒定功率载荷(CPLS)时能够具有较大信号稳定性的操作。要更具体,应在存在大量综合可再生能源和CPL,系统内部不确定性,外部干扰,耦合相互作用以及其他不利影响的情况下确保稳定性。从控制的角度来看,我们有意提出了一个通用解决方案,以实现互连系统的确切分散的跟踪控制任务。首先,提出了一种替代的有限时间馈电机制,该机制与反馈统治或递归取消过程基本不同。其次,可以从系统信息中直接构建一个comite控制器,因为它与稳定性分析相脱。提议的设计框架的一个主要优点是它降低了设计的复杂性,因此促进了实际实现。作为直接应用,为自主DC微电网系统构建了一个简单的分散复合控制器。数值模拟和实验比较结果都表明,在各种不同情况下,DC微电网实现了大信号稳定性。
从演示中学习(LFD)可以是通过使“学生”代理人从最有经验的“老师”代理商的演示中学习,而不是同时培训他们的政策,从而是一种用类似代理培训系统的有效方法。但是,当代理能力存在差异时,例如发散的执行力或关节角度约束时,天真地复制了符合学生能力的范围的示例,可以限制有效的学习。我们提出了一个专门针对教师和学生代理人之间异质性挑战的教师学习框架。我们的框架是基于“惊喜”的概念,其灵感来自于其在稀疏奖励环境中探索激励中的应用。感到惊讶,以使教师能够检测并适应自身与学生之间的差异。通过重点关注对环境的惊喜,同时最大程度地减少了学生对示威活动的惊喜,教师代理人可以有效地根据学生的特定能力和约束来量身定制演示。我们通过在稀疏回报环境中证明学生在控制任务中的学习中的改进来验证我们的方法。关键字:从示范,惊喜,异质代理人,教学代理人中学习
摘要 - 越来越多地使用深入强化学习(DRL)框架来解决机器人技术中的高维连续控制任务。然而,由于缺乏样本效率,在机器人域中将DRL应用于在线学习实际上仍然是不可行的。一个原因是,DRL代理不利用以前任务的解决方案。基于后继功能(SFS)的多任务DRL代理的最新工作已被证明在提高样本效率方面非常有前途。在这项工作中,我们提出了一种新的方法,该方法统一了两个先前的多任务RL框架,SF-GPI和价值组成,并将它们适应连续的控制域。我们利用后继功能的组成属性来构成一组原始人的策略分布,而无需培训任何新的政策。最后,为了证明多任务机制,我们基于Isaacgym提出了概念验证的基准环境,尖端和指针,这有助于大规模平行化以加速实验。我们的实验结果表明,我们的多任务代理具有与软演员 - 批评者(SAC)相同的单任务性能,并且代理可以成功地转移到新的看不见的任务中。我们在https://github.com/robot-poception-group/ concurrent_composition提供的代码作为开放源代码。
利用大型和多样化数据集的无监督预训练方法已在多个领域取得了巨大成功。近期研究已针对基于模型的强化学习 (MBRL) 研究了此类无监督预训练方法,但仅限于特定领域或模拟数据。本文中,我们研究了使用丰富的自然视频预训练世界模型的问题,以便高效学习下游视觉控制任务。然而,自然视频具有各种复杂的情境因素,例如错综复杂的背景和纹理外观,这妨碍了世界模型提取共享的世界知识以更好地概括。为了解决这个问题,我们引入了情境化世界模型 (ContextWM),它明确地分离情境和动态建模,以克服自然视频的复杂性和多样性,并促进不同场景之间的知识转移。具体来说,我们精心实现了潜在动力学模型的上下文化扩展,通过引入上下文编码器来保留上下文信息并赋能图像解码器,从而促使潜在动力学模型专注于关键的时间变化。我们的实验表明,搭载 ContextWM 的野外视频预训练可以显著提升 MBRL 在机器人操控、运动和自动驾驶等多个领域的采样效率。代码可从以下代码库获取:https://github.com/thuml/ContextWM。
摘要 随着机场资源不断扩展以满足日益增长的服务需求,有效利用地面基础设施对于确保运营效率越来越重要。运筹学研究已经产生了一些算法,为机场塔台管制员提供有关航班到达、离开和地面移动的最佳时间和顺序的指导。虽然这种决策支持系统有可能提高运营效率,但它们也可能影响用户的心理工作量、态势感知和任务绩效。这项工作旨在确定人类决策者在实验性机场地面移动控制任务中采用的绩效结果和策略,目的是确定增强以用户为中心的塔台管制决策支持系统的机会。为了应对这一挑战,30 名新手参与者解决了一组以游戏形式呈现的车辆路线问题,代表跑道管制员执行的机场地面移动任务。游戏在两个独立变量上有所不同,即网络地图布局(代表任务复杂性)和游戏目标(代表任务灵活性),而口头协议、视觉协议、任务表现、工作量和任务持续时间则被收集为因变量。逻辑回归分析显示,游戏目标和任务持续时间显著影响参与者确定游戏最佳解决方案的可能性,其中
我们开发了一项基于语音的自定步调光标控制任务,以在单独发出音素(即元音、鼻音和摩擦音)时收集相应的颅内神经数据。两名植入颅内深度电极以进行临床癫痫监测的患者通过实时处理麦克风输入执行闭环语音光标控制。在事后数据分析中,我们搜索了与非特定语音或特定音素的发生相关的神经特征。与之前的研究一致,我们在颞上回的多个记录点观察到了对语音的开始和持续反应。基于高达 200 Hz 的窄频带中的不同激活模式,我们以 91% 的准确率(机会水平:50%)跟踪语音活动,并以 68% 的准确率(机会水平:20%)将单个话语归类为五个音素之一。我们提出,我们的框架可以扩展到其他音素,以更好地描述在没有语言背景的情况下产生和感知语音的神经生理机制。总的来说,我们的研究结果为使用颅内电极开发语音脑机接口提供了补充证据和信息。索引词:音素识别、颅内电极、语音开始、持续语音、脑机接口
摘要:深入强化学习(DRL)已被证明对几种复杂的决策应用有效,例如自主驾驶和机器人技术。但是,众所周知,DRL受到其高样本复杂性和缺乏稳定性的限制。先验知识,例如,作为专家演示,通常可以使用,但要挑战以减轻这些问题。在本文中,我们提出了一般增强模仿(GRI),这是一种新颖的方法,结合了探索和专家数据的好处,并且可以直接实施任何非政策RL算法。我们做出了一个简化的假设:可以将专家演示视为完美的数据,其基础政策将获得不断的高奖励。基于此假设,GRI介绍了示范剂的概念。该代理发送专家数据,这些数据是与在线RL勘探代理所带来的经验同时且无法区分的。我们表明,我们的方法可以对城市环境中基于摄像机的自动驾驶进行重大改进。我们在使用不同的非政策RL算法的穆约科克连续控制任务上进一步验证了GRI方法。我们的方法在Carla排行榜上排名第一个,在先前的最新方法中,在Rails上胜过17%。
武汉科技大学,卢山路122号,洪贝山区,武汉,河北430070,B中国b电气工程和计算机科学学院,昆士兰技术大学,昆士兰技术大学2号,乔治·史密斯大学,昆士兰市,昆士兰4000,澳大利亚4000,澳大利亚澳大利亚4000号,澳大利亚Colls Roy coly@ntuy ntuany nanyangy nanyangy nanyangany nanyangy nanyangy nanyangy nanyangy nanyany, 637460,新加坡 *通讯作者。 电子邮件地址:yang.li@whut.edu.cn(Y. li),mahinda.vilathgamuwa@qut.edu.au(M。vilathgamuwa),sanshing.choi@qut.edu.edu.edu.edu.au(S。S. Choi(S。Choi),bxiong2@whut.edu.edu.ccn(B.Xiong) tangjinrui@whut.edu.cn(J。Tang),suyixin@whut.edu.cn(Y。su),wang_yu@ntu.edu.edu.sg(Y。Wang)。 摘要:检查了锂离子(锂离子)电池储能系统(BES)的应用,以实现可再生电厂的可调节性。 考虑使用电化学原理评估电池电池降解的影响,BES的功率流模型(PFM)是专门用于系统级研究的。 PFM允许预测电池的长期性能和寿命,就像BESS执行功率调度控制任务时一样。 此外,提出了二进制模式控制方案,以防止由于不确定的可再生输入功率而导致的BES的过度付费/过排。 对产生的新调度控制方案的分析表明,提出的自适应贝斯能量控制器可以保证调度过程的稳定性。 关键字:锂离子电池,可再生电源分配性,电池降解,电池储能系统武汉科技大学,卢山路122号,洪贝山区,武汉,河北430070,B中国b电气工程和计算机科学学院,昆士兰技术大学,昆士兰技术大学2号,乔治·史密斯大学,昆士兰市,昆士兰4000,澳大利亚4000,澳大利亚澳大利亚4000号,澳大利亚Colls Roy coly@ntuy ntuany nanyangy nanyangy nanyangany nanyangy nanyangy nanyangy nanyangy nanyany, 637460,新加坡 *通讯作者。 电子邮件地址:yang.li@whut.edu.cn(Y. li),mahinda.vilathgamuwa@qut.edu.au(M。vilathgamuwa),sanshing.choi@qut.edu.edu.edu.edu.au(S。S. Choi(S。Choi),bxiong2@whut.edu.edu.ccn(B.Xiong) tangjinrui@whut.edu.cn(J。Tang),suyixin@whut.edu.cn(Y。su),wang_yu@ntu.edu.edu.sg(Y。Wang)。 摘要:检查了锂离子(锂离子)电池储能系统(BES)的应用,以实现可再生电厂的可调节性。 考虑使用电化学原理评估电池电池降解的影响,BES的功率流模型(PFM)是专门用于系统级研究的。 PFM允许预测电池的长期性能和寿命,就像BESS执行功率调度控制任务时一样。 此外,提出了二进制模式控制方案,以防止由于不确定的可再生输入功率而导致的BES的过度付费/过排。 对产生的新调度控制方案的分析表明,提出的自适应贝斯能量控制器可以保证调度过程的稳定性。 关键字:锂离子电池,可再生电源分配性,电池降解,电池储能系统武汉科技大学,卢山路122号,洪贝山区,武汉,河北430070,B中国b电气工程和计算机科学学院,昆士兰技术大学,昆士兰技术大学2号,乔治·史密斯大学,昆士兰市,昆士兰4000,澳大利亚4000,澳大利亚澳大利亚4000号,澳大利亚Colls Roy coly@ntuy ntuany nanyangy nanyangy nanyangany nanyangy nanyangy nanyangy nanyangy nanyany, 637460,新加坡 *通讯作者。 电子邮件地址:yang.li@whut.edu.cn(Y. li),mahinda.vilathgamuwa@qut.edu.au(M。vilathgamuwa),sanshing.choi@qut.edu.edu.edu.edu.au(S。S. Choi(S。Choi),bxiong2@whut.edu.edu.ccn(B.Xiong) tangjinrui@whut.edu.cn(J。Tang),suyixin@whut.edu.cn(Y。su),wang_yu@ntu.edu.edu.sg(Y。Wang)。 摘要:检查了锂离子(锂离子)电池储能系统(BES)的应用,以实现可再生电厂的可调节性。 考虑使用电化学原理评估电池电池降解的影响,BES的功率流模型(PFM)是专门用于系统级研究的。 PFM允许预测电池的长期性能和寿命,就像BESS执行功率调度控制任务时一样。 此外,提出了二进制模式控制方案,以防止由于不确定的可再生输入功率而导致的BES的过度付费/过排。 对产生的新调度控制方案的分析表明,提出的自适应贝斯能量控制器可以保证调度过程的稳定性。 关键字:锂离子电池,可再生电源分配性,电池降解,电池储能系统武汉科技大学,卢山路122号,洪贝山区,武汉,河北430070,B中国b电气工程和计算机科学学院,昆士兰技术大学,昆士兰技术大学2号,乔治·史密斯大学,昆士兰市,昆士兰4000,澳大利亚4000,澳大利亚澳大利亚4000号,澳大利亚Colls Roy coly@ntuy ntuany nanyangy nanyangy nanyangany nanyangy nanyangy nanyangy nanyangy nanyany, 637460,新加坡 *通讯作者。 电子邮件地址:yang.li@whut.edu.cn(Y. li),mahinda.vilathgamuwa@qut.edu.au(M。vilathgamuwa),sanshing.choi@qut.edu.edu.edu.edu.au(S。S. Choi(S。Choi),bxiong2@whut.edu.edu.ccn(B.Xiong) tangjinrui@whut.edu.cn(J。Tang),suyixin@whut.edu.cn(Y。su),wang_yu@ntu.edu.edu.sg(Y。Wang)。 摘要:检查了锂离子(锂离子)电池储能系统(BES)的应用,以实现可再生电厂的可调节性。 考虑使用电化学原理评估电池电池降解的影响,BES的功率流模型(PFM)是专门用于系统级研究的。 PFM允许预测电池的长期性能和寿命,就像BESS执行功率调度控制任务时一样。 此外,提出了二进制模式控制方案,以防止由于不确定的可再生输入功率而导致的BES的过度付费/过排。 对产生的新调度控制方案的分析表明,提出的自适应贝斯能量控制器可以保证调度过程的稳定性。 关键字:锂离子电池,可再生电源分配性,电池降解,电池储能系统武汉科技大学,卢山路122号,洪贝山区,武汉,河北430070,B中国b电气工程和计算机科学学院,昆士兰技术大学,昆士兰技术大学2号,乔治·史密斯大学,昆士兰市,昆士兰4000,澳大利亚4000,澳大利亚澳大利亚4000号,澳大利亚Colls Roy coly@ntuy ntuany nanyangy nanyangy nanyangany nanyangy nanyangy nanyangy nanyangy nanyany, 637460,新加坡 *通讯作者。电子邮件地址:yang.li@whut.edu.cn(Y. li),mahinda.vilathgamuwa@qut.edu.au(M。vilathgamuwa),sanshing.choi@qut.edu.edu.edu.edu.au(S。S. Choi(S。Choi),bxiong2@whut.edu.edu.ccn(B.Xiong) tangjinrui@whut.edu.cn(J。Tang),suyixin@whut.edu.cn(Y。su),wang_yu@ntu.edu.edu.sg(Y。Wang)。摘要:检查了锂离子(锂离子)电池储能系统(BES)的应用,以实现可再生电厂的可调节性。考虑使用电化学原理评估电池电池降解的影响,BES的功率流模型(PFM)是专门用于系统级研究的。PFM允许预测电池的长期性能和寿命,就像BESS执行功率调度控制任务时一样。此外,提出了二进制模式控制方案,以防止由于不确定的可再生输入功率而导致的BES的过度付费/过排。对产生的新调度控制方案的分析表明,提出的自适应贝斯能量控制器可以保证调度过程的稳定性。关键字:锂离子电池,可再生电源分配性,电池降解,电池储能系统开发了粒子群优化算法,并将其纳入计算过程中,通过最小化贝斯的资本成本加上违反调度电源承诺的罚款成本,确定了最佳电池容量和功率评级。用于说明拟议设计方法的数值示例的结果表明,为了实现100兆瓦风电场的每小时稳定功率调度性,最低成本的锂离子贝丝的额定值为31毫米/22.6毫米。
摘要 — 手动控制控制论旨在利用人类控制动力学的数学模型来理解和描述人类如何控制车辆和设备。这种“控制论方法”可以对人类行为进行客观和定量的比较,并可以系统地优化与手动控制相关的人机控制界面和培训。当前的控制论理论主要基于 20 世纪 60 年代形式化的技术和分析方法,并且已被证明在捕捉人类认知和控制的全部范围方面能力有限。本文回顾了我们对人类手动控制知识的当前最新水平,指出了控制论的主要基本局限性,并提出了推进该理论及其应用的可能路线图。该路线图的核心将从当前的线性时不变建模方法(仅适用于严格控制和静止条件下的人类行为)转变为有助于分析现实控制任务中自适应且可能随时间变化的人类行为的方法。本文介绍了控制论领域当前的关键发展实例,这些发展有助于实现这一转变,包括人类对预览的使用、可预测的离散机动、技能获取和训练、随时间变化的人体建模以及神经肌肉系统建模。这些努力将为控制论奠定新的基础,并将影响人类所从事的所有领域。