本研究探索了基于医疗指南的生成式预训练 Transformer (GPT) 代理使用大型语言模型 (LLM) 技术在创伤性脑损伤 (TBI) 康复相关问题上的应用。为了评估使用 GPT-4 创建的多个代理 (GPT-agents) 的有效性,使用直接 GPT-4 作为对照组 (GPT-4) 进行了比较。GPT-agents 包含多个具有不同功能的代理,包括“医疗指南分类”、“问题检索”、“匹配评估”、“智能问答 (QA)”和“结果评估与来源引用”。从医患问答数据库中选择了脑康复问题进行评估。主要终点是更好的答案。次要终点是准确性、完整性、可解释性和同理心。回答了 30 个问题;总体而言,GPT 代理的响应时间比 GPT-4 长得多,而且字数也更多(时间:54.05 vs. 9.66 秒,字数:371 vs. 57)。但是,与 GPT-4 相比,GPT 代理在更多情况下提供了更出色的答案(66.7 vs. 33.3%)。GPT 代理在准确度评估方面优于 GPT-4(3.8 ± 1.02 vs. 3.2 ± 0.96,p = 0.0234)。未发现不完整答案的差异(2 ± 0.87 vs. 1.7 ± 0.79,p = 0.213)。然而,在可解释性(2.79 ± 0.45 vs. 07 ± 0.52,p < 0.001)和同理心(2.63 ± 0.57 vs. 1.08 ± 0.51,p < 0.001)评估方面,GPT 代理表现明显更好。根据医学指南,GPT 代理提高了对 TBI 康复问题回答的准确性和同理心。本研究提供了指南参考,并展示了更好的临床可解释性。然而,需要通过临床环境中的多中心试验进一步验证。本研究提供了实用见解,并为 LLM 代理医学的潜在理论整合奠定了基础。
自动化工厂、核电站、电信中心和空间站等设施的计算机控制操作环境正变得越来越复杂。随着这种复杂性的增长,使用集中管理和调度策略来控制此类环境将变得越来越困难,这些策略既能应对意外事件,又能灵活应对可能随时间发生的操作和环境变化。解决这个问题的一个越来越有吸引力的方法是将此类操作的控制权分配给许多智能的、完成任务的计算代理。现实世界领域可能由多个代理填充。在这样的领域中,代理通常会执行许多复杂的任务,需要在一定程度上关注环境变化、时间约束、计算资源界限以及代理的短期行动可能对其长期目标产生的影响。在现实世界中运作意味着必须在时间和空间的多个粒度级别上处理意外事件。虽然代理必须保持反应能力才能生存,但如果代理要与其他代理协调其行动并以有效的方式处理复杂任务,则需要一定程度的战略和预测决策。本论文提出了一种新的集成代理架构,旨在为理性、自主、移动的代理提供在动态、实时、多代理领域中执行复杂、资源受限任务通常所需的各种行为。在调查了一系列现有架构并充分考虑了在特定领域中产生有效、稳健和灵活行为的要求后,通过集成许多审议和非审议控制功能,设计了最终的软件控制架构——TouringMachine 代理架构。这些功能以分层方式排列,组合起来赋予代理丰富的反应、目标导向、反思和预测能力。认识到代理的内部配置、任务环境和随后的行为库之间存在的复杂关系,代理架构已与功能丰富的仪器化模拟测试平台结合实施。该测试平台允许创建多种单智能体和多智能体导航任务场景,已用于评估架构的实用性并确定其一些主要优点和缺点。
增强学习(RL)是代理通过与经验数据集进行交互来学习最佳行为的过程,所有这些都旨在最大化奖励信号。rl算法通常在现实世界应用中面临性能挑战,尤其是在使用广泛而多样的数据集培训时。例如,诸如自动驾驶汽车之类的应用程序包括感官数据,Dy-Namic的交通信息(包括其他车辆和行人的运动),关键的风险评估以及各种代理行动。因此,由于对大量体验数据集进行了抽样,因此RL训练可能完全不适合硬件缓存,并且在内存和计算单元(例如CPU,GPU)之间所需的频繁数据传输,尤其是批量批次更新。这种瓶颈会产生大量的执行潜伏期,并影响整体培训时间。为了减轻最近提出的以内存为中心的计算范例(例如内存中的处理(PIM)),可以通过执行内存设备内的计算来解决与内存延迟相关的瓶颈。在本文中,我们介绍了Swiftrl,该文章探讨了现实世界中PIM体系结构加速流行的RL工作负载及其培训阶段的潜力。我们在Upmem Pim系统上调整了RL算法,即Tabular Q-Learning和SARSA,并首先使用两种不同的环境和三种采样策略观察他们的性能。此外,我们开发和评估了针对硬件优化的Q学习的多代理版本,并说明了如何使用多个代理来利用PIM进行算法缩放。然后,我们通过近似Q值更新功能(由于运行时库使用的运行时指令仿真而避免了高性能成本),并结合了基础算法所需的某些PIM特异性例程,从而实现了RL适应PIM期间的性能选择策略。我们使用Upmem硬件在OpenAI健身房环境上实验评估RL工作负载。我们的结果表明,当PIM核心数量增加16×(125至2000)时,性能的近线性缩放比例为15倍。我们还将我们的PIM实施与Intel(R)Xeon(R)Silver 4110 CPU和NVIDIA RTX 3090 GPU进行了比较,并在Upmem PIM系统上观察到具有不同实现的UPMEM PIM系统。
自动化工厂、核电站、电信中心和空间站等设施的计算机控制操作环境正变得越来越复杂。随着这种复杂性的增长,使用集中管理和调度策略来控制此类环境将变得越来越困难,这些策略既能应对意外事件,又能灵活应对可能随时间发生的操作和环境变化。解决这个问题的一个越来越有吸引力的方法是将此类操作的控制权分配给许多智能的、能够完成任务的计算代理。现实世界领域可能由多个代理组成。在这样的领域中,代理通常会执行许多复杂的任务,这些任务需要在一定程度上关注环境变化、时间限制、计算资源界限以及代理的短期行动可能对其长期目标产生的影响。在现实世界中操作意味着必须在时间和空间的多个粒度级别上处理意外事件。虽然代理必须保持反应才能生存,但如果代理要与其他代理协调行动并以有效的方式处理复杂任务,则需要一定程度的战略和预测决策。本论文提出了一种新的集成代理架构,旨在为理性、自主、移动的代理提供在动态、实时、多代理领域中执行复杂、资源受限任务通常所需的各种行为。在调查了一系列现有架构并充分考虑了在特定此类领域中产生有效、稳健和灵活行为的要求后,通过集成许多审议和非审议控制功能,设计了最终的软件控制架构——TouringMachine 代理架构。这些功能以分层方式排列,组合起来赋予代理丰富的反应、目标导向、反思和预测能力。考虑到代理的内部配置、任务环境和随后的行为库之间存在的复杂关系,代理架构已与功能丰富的仪表化模拟测试平台结合实施。该测试平台允许创建一组不同的单代理和多代理导航任务场景,已用于评估架构的实用性并确定其一些主要优点和缺点。
自动化工厂、核电站、电信中心和空间站等设施的计算机控制操作环境正变得越来越复杂。随着这种复杂性的增长,使用集中管理和调度策略来控制此类环境将变得越来越困难,这些策略既能应对意外事件,又能灵活应对可能随时间发生的操作和环境变化。解决这个问题的一个越来越有吸引力的方法是将此类操作的控制权分配给许多智能的、能够完成任务的计算代理。现实世界领域可能由多个代理组成。在这样的领域中,代理通常会执行许多复杂的任务,这些任务需要在一定程度上关注环境变化、时间限制、计算资源界限以及代理的短期行动可能对其长期目标产生的影响。在现实世界中操作意味着必须在时间和空间的多个粒度级别上处理意外事件。虽然代理必须保持反应才能生存,但如果代理要与其他代理协调行动并以有效的方式处理复杂任务,则需要一定程度的战略和预测决策。本论文提出了一种新的集成代理架构,旨在为理性、自主、移动的代理提供在动态、实时、多代理领域中执行复杂、资源受限任务通常所需的各种行为。在调查了一系列现有架构并充分考虑了在特定此类领域中产生有效、稳健和灵活行为的要求后,通过集成许多审议和非审议控制功能,设计了最终的软件控制架构——TouringMachine 代理架构。这些功能以分层方式排列,组合起来赋予代理丰富的反应、目标导向、反思和预测能力。考虑到代理的内部配置、任务环境和随后的行为库之间存在的复杂关系,代理架构已与功能丰富的仪表化模拟测试平台结合实施。该测试平台允许创建一组不同的单代理和多代理导航任务场景,已用于评估架构的实用性并确定其一些主要优点和缺点。
自动化工厂、核电站、电信中心和空间站等设施的计算机控制操作环境正变得越来越复杂。随着这种复杂性的增长,使用集中管理和调度策略来控制此类环境将变得越来越困难,这些策略既能应对意外事件,又能灵活应对可能随时间发生的操作和环境变化。解决这个问题的一个越来越有吸引力的方法是将此类操作的控制权分配给许多智能的、能够完成任务的计算代理。现实世界领域可能由多个代理组成。在这样的领域中,代理通常会执行许多复杂的任务,这些任务需要在一定程度上关注环境变化、时间限制、计算资源界限以及代理的短期行动可能对其长期目标产生的影响。在现实世界中操作意味着必须在时间和空间的多个粒度级别上处理意外事件。虽然代理必须保持反应才能生存,但如果代理要与其他代理协调行动并以有效的方式处理复杂任务,则需要一定程度的战略和预测决策。本论文提出了一种新的集成代理架构,旨在为理性、自主、移动的代理提供在动态、实时、多代理领域中执行复杂、资源受限任务通常所需的各种行为。在调查了一系列现有架构并充分考虑了在特定此类领域中产生有效、稳健和灵活行为的要求后,通过集成许多审议和非审议控制功能,设计了最终的软件控制架构——TouringMachine 代理架构。这些功能以分层方式排列,组合起来赋予代理丰富的反应、目标导向、反思和预测能力。考虑到代理的内部配置、任务环境和随后的行为库之间存在的复杂关系,代理架构已与功能丰富的仪表化模拟测试平台结合实施。该测试平台允许创建一组不同的单代理和多代理导航任务场景,已用于评估架构的实用性并确定其一些主要优点和缺点。
以现有技术构建的量子计算机难以小型化,也不太可能成为笔记本电脑或手机等个人电子产品 [1–4]。因此,基于云的服务被认为是向公众提供量子计算机访问权限的最适用方法。人们自然会问,当无法完全控制量子硬件时,是否可以保持量子算法的隐私。盲量子计算 (BQC) 旨在解决这个问题。量子算法可以在第三方量子代理上使用 BQC 协议执行,同时保持算法、数据和结果的机密性 [5, 6]。这里我们讨论了两种实现通用量子计算的方法。一种是基于门的量子计算 (GBQC) [7]。该方法从纯量子态开始,通常将所有量子位重置为零。然后,它使用一系列量子门转换量子态。最终的输出状态携带处理后的信息。另一种方法称为基于测量的量子计算 (MBQC) 或单向量子计算 [8–11]。该方法准备一个高度纠缠的多个量子比特状态,通常称为簇状态 [12],然后执行一系列测量和校正来实现计算。最终它可以给出与 GBQC 相同的结果。[6] 基于 MBQC 框架提出了通用盲量子计算 (UBQC) 协议。UBQC 协议利用通用簇状态,可以由具有单个代理的半经典客户端或具有多个代理的完全经典客户端实现。还有其他提案可以使用单个代理和完全经典客户端实现 BQC,但是,这些提案需要一些计算假设 [13–15]。在本文中,我们利用量子图形推理方法 ZX-Calculus 来推导可以用多个代理和完全经典客户端实现的 BQC 协议。UBQC 协议利用通用簇状态,强制将描述算法的所有信息编码在测量轴中。它牺牲了将信息编码到量子比特之间的纠缠结构中的能力。相反,我们的方法确实将信息编码在纠缠结构中,并且不需要通用簇状态。这使得我们的协议更加节省资源。本文安排如下:第二节 B 描述了 ZX 演算,这是一种图形量子推理技术,我们用它来推导结果。第三节解释了我们的 BQC 协议。第四节证明了我们协议的正确性和安全性。第六节讨论了与现有验证协议的兼容性,并量化了我们的协议和 UBQC 协议的资源成本。第七节总结了本文。
高管说,缺乏对如何推动大量业务绩效改善的明确,共同的愿景,这是对高科技投资回报率的强烈障碍)