摘要 - 越来越多地使用深入强化学习(DRL)框架来解决机器人技术中的高维连续控制任务。然而,由于缺乏样本效率,在机器人域中将DRL应用于在线学习实际上仍然是不可行的。一个原因是,DRL代理不利用以前任务的解决方案。基于后继功能(SFS)的多任务DRL代理的最新工作已被证明在提高样本效率方面非常有前途。在这项工作中,我们提出了一种新的方法,该方法统一了两个先前的多任务RL框架,SF-GPI和价值组成,并将它们适应连续的控制域。我们利用后继功能的组成属性来构成一组原始人的策略分布,而无需培训任何新的政策。最后,为了证明多任务机制,我们基于Isaacgym提出了概念验证的基准环境,尖端和指针,这有助于大规模平行化以加速实验。我们的实验结果表明,我们的多任务代理具有与软演员 - 批评者(SAC)相同的单任务性能,并且代理可以成功地转移到新的看不见的任务中。我们在https://github.com/robot-poception-group/ concurrent_composition提供的代码作为开放源代码。
光子量子信息处理是量子技术的主要平台之一 1 – 5,它主要依靠光量子干涉来产生不可或缺的有效光子 - 光子相互作用。然而,由于光子的玻色子性质 7 和传统酉光学元件的受限相位响应 8、9,这种有效的相互作用从根本上局限于聚束 6。在这里,我们提出并通过实验证明了非酉超表面实现的光量子干涉的新自由度。由于独特的各向异性相位响应产生了两个极端的本征操作,我们展示了对两个单光子有效相互作用的动态和连续控制,使得它们表现出玻色子聚束、费米子反聚束或任意中间行为,超出了它们固有的玻色子性质。这种量子操作为基础的量子光物质相互作用和用于量子通信、量子模拟和量子计算的创新光子量子装置打开了大门。超材料是一种具有亚波长元素的结构化材料,可以实现自然界中无法找到的波响应。通过定制超材料,人们已经展示了诸如负折射率、亚衍射成像和隐形斗篷等前所未有的特性 10 – 13 。超表面(二维超材料)使我们能够利用平面光学任意定制经典光的波前和传播 14 – 18 。同时,光子是极好的量子信息载体,因为它们具有长相干时间、室温稳定性、易于操纵和光速信号传输。使用单光子源、分束器、移相器和单光子探测器的量子光子学一直是量子计算、量子模拟和量子通信的主要平台之一 1 – 5 。因此,将超材料无与伦比的光控制与量子光学相结合,可以带来量子信息应用的全新可能性 19 – 22 。光子量子信息处理应用(如线性光学量子计算 1 、玻色子采样 23、24、量子行走 25 和量子通信 26)的核心操作单元是量子双光子干涉 (QTPI)。分束器是此量子操作的关键元素。当两个无法区分的单光子同时到达 50:50 分束器的两个输入端口时,QTPI 表现为洪-欧-曼德尔 (HOM) 效应 6 。在原始的 HOM 实验中,两个光子总是聚集在一起,并以相同的输出离开分束器