用强

2024年2月11日机构名称:

智能库：使用强化学习的多代理路径计划物流操作

机器人导航在运输，制造和开发部门中具有重要意义。路径规划的优先级对于在多个机器人共存的环境中的有效导航至关重要。在逻辑库的领域中，其特征是重复的任务需要减轻人类错误，本研究集中于实现可行且最佳的路径计划，用于在两层建筑中运输书籍的多个代理商。基于Q学习的拟议算法结合了转移和课程学习，使代理人之间的合作和分散行为能够。通过软件内部方法进行的数值实验验证了该方法的效果。结果表明，与单个代理相比，任务完成步骤的成功率为94％，伴随着任务完成步骤的73.36％。本研究旨在展示该算法在增强多代理物流设置（尤其是在智能库环境中）的导航和任务效率方面的功能。

查看详细

File

2024年1月11日机构名称:

利用强化学习实现自动化 RISC-V 微架构设计

7 Nathan Binkert、Bradford Beckmann、Gabriel Black 等人（2011 年）。“Gem5 模拟器”。引自：SIGARCH Comput. Archit. News 39.2，第 1-7 页。8 Jason Lowe-Power 等人（2020 年）。“GEM5 模拟器：版本 20.0+”。引自：arXiv 预印本 arXiv:2007.03152。9 Sheng Li 等人（2009 年）。“McPAT：用于多核和众核架构的集成功率、面积和时序建模框架”。引自：IEEE/ACM 国际微架构研讨会 (MICRO)，第 469-480 页。

查看详细

File

2023年12月14日机构名称:

授权可信赖的客户选择在边缘联盟学习利用强化学习

联合学习（FL）是一种在不共享原始本地数据的情况下培训Edge Computing（EC）中多个客户端的AI模型的有前途的方法。通过启用本地培训并将更新汇总到全球模型中，FL在促进协作学习的同时保持隐私。从未有过，FL遇到了一些挑战，包括您的客户参与，由于患有恶意或不准确的模型而导致的客户效率低下的模型聚合。在本文中，我们提出了一种可信赖的FL方法，该方法结合了Q学习，信任和声誉机制，增强了模型的认可和公平性。此方法促进客户参与，减轻恶意攻击的影响并确保公平的模型分布。受强化学习的启发，Q学习算法使用Bellman方程优化了客户选择，从而使服务器能够平衡探索和开发，以改善系统性能。更重要的是，我们探索了点对点fl设置的优势。广泛的实验证明了我们提出的可信赖的FL方法在实现高学习准确性方面的有效性，同时确保客户之间的公平性并保持有效的客户选择。我们的结果揭示了模型性能，收敛速度和概括方面的显着改善。

查看详细

File

2023年10月27日机构名称:

使用强化学习对量子电路进行经典模拟：并行环境和基准

谷歌的“量子霸权”公告 [3] 受到了学术界和工业界的广泛质疑，因为 Summit 超级计算机上经典模拟任务的运行时间估计为 10,000 年，这一估计存在争议。“量子霸权”已经到来了吗？还是一二十年后才会到来？为避免科技巨头或量子初创公司仓促宣传“量子霸权”，并消除专门组建团队进行经典模拟任务的成本，我们提倡采用开源方法来维持可靠的基准性能。在本文中，我们采用强化学习方法进行量子电路的经典模拟，并通过报告估计模拟时间少于 4 天、比最先进方法加速 5.40 倍来展示其巨大潜力。具体来说，我们使用 K-spin Ising 模型将经典模拟任务公式化为张量网络收缩排序问题，并采用一种基于汉密尔顿的新型强化学习算法。然后，我们评估量子电路经典模拟的性能。我们开发了十几个大规模并行环境来模拟量子电路。我们开源了我们的并行 gym 环境和基准。

查看详细

File

2023年8月10日机构名称:

使用强化学习

这项工作建立了一个有效的基于AI的消息生成系统，用于在农村地区预防糖尿病，在这种情况下，糖尿病率一直以惊人的速度增加。信息包含有关糖尿病原因和并发症的信息，以及营养和健身对预防疾病的影响。我们建议应用强化学习（RL），以优化我们的消息选择随着时间的流逝，以量身定制我们的消息以与每个参与者的需求和偏好保持一致。我们在印度进行了一项广泛的实地研究，其中涉及1000多名参与者，他们是村民，他们在六个月的时间内收到了我们系统产生的信息。我们的分析表明，与静态消息集相比，通过使用AI，我们可以在参与者的糖尿病相关知识，体育锻炼和避免高脂食品的避免方面取得显着改善。此外，我们构建了一个新的基于神经网络的行为模型，以预测参与者的情况变化。通过利用与健康相关行为的非衍生特征，我们设法显着提高了模型的预测准确性与基线相比。

查看详细

File

2023年5月24日机构名称:

用强大的概率方法

对地球物理逆问题的解决方案的非唯一性可能会导致误解，同时表征地下。为了解决这种情况，可以使用发掘和井中的基础真实信息来改进，校准和解释倒置模型。我们将定量插入介绍为基于概率理论的决策分析，该分析的重点是解决分类问题。首先，我们提出了一种使用多个数据源在钻孔日志中观察到的不同类型的材料或“类别”的概率方法：倒2D电阻率层析成像以及这些钻孔的极化数据和位置（X，Z）。然后，使用贝叶斯的规则和比率的持续性，我们将每个类别的联合条件概率概述，鉴于整个倒置模型域中的所有数据源。我们通过复杂的合成数据建模来验证这种方法

查看详细

File

2023年4月4日机构名称:

使用强化学习对量子计算进行编译器优化

摘要 — 任何量子计算应用程序一旦被编码为量子电路，就必须先进行编译，然后才能在量子计算机上执行。与传统编译类似，量子编译是一个顺序过程，具有许多编译步骤和许多可能的优化过程。尽管有相似之处，但量子计算编译器的开发仍处于起步阶段——缺乏对最佳过程顺序、兼容性、适应性和灵活性的相互整合。在这项工作中，我们利用数十年的经典编译器优化，提出了一个强化学习框架来开发优化的量子电路编译流程。通过不同的约束和统一的接口，该框架支持在单个编译流程中结合使用来自不同编译器和优化工具的技术。实验评估表明，所提出的框架（由 IBM 的 Qiskit 和 Quantinuum 的 TKET 中选择的编译过程设置）在 73% 的预期保真度情况下明显优于两个单独的编译器。该框架作为慕尼黑量子工具包 (MQT) 的一部分在 GitHub (https://github. com/cda-tum/MQTPredictor) 上提供。

查看详细

File

2022年9月15日机构名称:

AI4CE - 利用强化学习自动生成太空任务设计概念

假设以 MBSE 为中心的设计成为新的现实，在此基础上，考虑到人工智能 (AI) 领域的成就，用基于 AI 的助手支持早期系统设计似乎是下一个合乎逻辑的步骤。并行工程人工智能 (AI4CE) 研究项目提供了独特的可能性，将并行工程 (CE)、基于模型的系统工程 (MBSE) 和创新系统创建的形式结合起来。它通过一个交互式过程实现了知识库和本体的使用，设计团队定义系统需求并从生成的设计中受益。AI4CE 补充了专用于 MBSE 的概念系统设计过程，并利用了这种共生带来的优势：从模型中获取信息和约束，根据这些信息生成系统设计并将其直接引入同一模型。使用深度强化学习 (DRL)，该 AI 系统根据数据库中的可用组件构建概念设计。 AI 从该数据库中选择哪些确切组件的决定取决于给定的系统要求和 AI 的训练策略 - 即设计经验。首次测试可以证明这种方法的可行性，未来的研究重点是扩展其功能并将其集成到 CE 流程中。

查看详细

File

2022年10月4日机构名称:

利用强化学习实现量子纠缠交换管理，Open AI - GYM

1.1 纠缠作为基本资源 [1] 量子通信以纠缠为基础。当两个量子比特（一个经典比特的量子对应物）发生纠缠时，它们各自的状态无法单独描述：其中一个量子比特的状态变化（即量子比特读数）必然会导致另一个量子比特的变化，而不管它们之间的物理距离有多远。因此，两个纠缠量子比特的读数表现出非经典相关性，可用于设计经典通信无法实现的新应用，例如量子密码学或分布式量子计算。 1.2 基本链路与虚拟链路生成 [1] 基本链路是位于两个物理上分离的节点（例如图 1 中的节点 A 和 B 之间）的两个量子比特之间的纠缠。其成功概率P e 随着距离的增加而呈指数下降，这意味着短距离纠缠（例如图 1 中的 A 和 B 之间，或 B 和 C 之间）比长距离纠缠（例如图 1 中的 A 和 C 之间）更有可能成功。为了解决这个问题，我们可以通过纠缠交换在两个基本链接（例如 AB 和 BC）上创建一个虚拟链接（例如 AC）。此过程使用两个端点之间路径上先前生成的基本链接，以在两个远程端点之间产生新的纠缠对。当必须连续迭代此过程以创建非常长距离的纠缠时，中间生成的纠缠必须存储在所谓的量子存储器中以供以后使用。1.3 量子存储器寿命 [1] 存储在量子存储器中的量子比特在一定时间后仍处于其原始状态（例如纠缠态）的概率会随着时间的推移而减小。这个概率被称为记忆效率 η m [2]，它的衰减被称为退相干。这个过程是量子记忆与环境逐渐相互作用的结果，因为记忆不能完全与环境隔离。纠缠交换的成功概率 P s 取决于参与交换的最老加载量子记忆的记忆效率 η m。

查看详细

File

2022年8月22日机构名称:

脑机接口中使用强化学习的神经解码器：技术综述

创建灵活而强大的脑机接口 (BMI) 目前是一个热门的研究课题，医学、工程、商业和机器学习社区已经对此进行了数十年的探索。特别是，使用强化学习 (RL) 的技术已显示出令人印象深刻的结果，但在 BMI 社区中却代表性不足。为了进一步阐明这种有希望的关系，本文旨在对 RL 在 BMI 中的应用进行详尽的回顾。我们在这篇评论中的主要重点是提供基于 RL 的 BMI 中用于解码神经意图的各种算法的技术摘要，而不强调神经信号的预处理技术和 RL 的奖励建模。我们首先根据用于神经解码的 RL 方法类型组织文献，然后解释每种算法的学习策略及其在 BMI 中的应用。提供了比较分析，重点介绍了神经解码器之间的相似性和独特性。最后，我们以讨论 RLBMI 的现阶段结束这篇评论，包括它们的局限性和未来研究的有希望的方向。

查看详细

XiaoMi-AI文件搜索系统

用强

智能库：使用强化学习的多代理路径计划物流操作

利用强化学习实现自动化 RISC-V 微架构设计

授权可信赖的客户选择在边缘联盟学习利用强化学习

使用强化学习对量子电路进行经典模拟：并行环境和基准

使用强化学习

用强大的概率方法

使用强化学习对量子计算进行编译器优化

AI4CE - 利用强化学习自动生成太空任务设计概念

利用强化学习实现量子纠缠交换管理，Open AI - GYM

脑机接口中使用强化学习的神经解码器：技术综述

按机构统计排名前十媒体

按照发布年份统计数据

XiaoMi-AI