摘要:体现的AI正在逐步探索大型语言模型(LLMS),以进行机器人技术的有效计划。体现AI的最新进展使LLMS能够将视觉观察和高级目标提示解析为可执行子任务。但是,这些现有方法通常完全基于环境的初始状态执行计划,从而导致生成更长的计划时的基础弱化。通过以语言的形式纳入环境反馈来结合循环的一些最新指示。与这些方法不同,我们介绍了计划扩散器,这是一种新颖的“闭环”方法,用于逐步计划,并在循环的每个步骤中进行视觉反馈伴奏。具体来说,我们的方法自动加入采用LLM来生成单步文本子目标和扩散模型,以将其转化为可视觉子目标,用于后续计划。最后,一个能够实现这些亚目标图像的目标政策将其执行。对Ravens基准套件的全面评估表明,计划扩散器超过了最先进的方法,尤其是在长期任务中。此外,我们的方法在分发场景中证明了强大的概括性 - 可轻松处理看不见的颜色,对象和增加任务复杂性。
我们描述了两个针对临床文本的任务:命名实体识别(任务 1)和模板槽填充(任务 2)。这两个任务利用 ShARe 语料库中的注释,该语料库包含带有注释的临床记录,提及的疾病以及它们对医学术语和八个附加属性的规范化。这两个任务的目的是确定临床命名实体识别方面的进展,并确定疾病模板槽填充的最新技术。任务 2 包含两个子任务:根据黄金标准疾病跨度进行模板槽填充(任务 2a)以及端到端疾病跨度识别和模板槽填充(任务 2b)。对于任务 1(疾病跨度检测和规范化),有 16 支队伍参加。最佳系统的严格 F1 得分为 75.7,准确率为 78.3,召回率为 73.2。对于任务 2a(给定黄金标准无序跨度的模板槽填充),有六支队伍参与。最佳系统的槽填充综合总体加权准确率为 88.6。对于任务 2b(无序识别和模板槽填充),有九支队伍参与。最佳系统的综合宽松 F(跨度检测)和总体加权准确率为 80.8。
环境:环境保护不仅是法律,也是正确做法。这是一个持续的过程,从深思熟虑的规划开始。在训练和任务期间,始终注意保护环境的方法。这样做,您将为维持我们的训练资源做出贡献,同时保护人民和环境免受有害影响。请参阅当前的环境考虑手册和当前的 GTA 环境相关风险评估卡。请参阅 ATP 3-34.5 环境考虑和 GTA 05-08-002 环境相关风险评估。安全:在训练环境中,领导者必须根据当前的风险管理原则进行风险评估。领导者将根据 TRADOC 安全官在规划和完成每项任务和子任务时完成当前的深思熟虑风险评估工作表,评估任务、敌人、地形和天气、部队和支援可用时间以及民事考虑因素 (METT-TC)。注意:在 MOPP 培训期间,领导者必须确保监控人员是否可能受到热伤害。在高温等级增加时,必须遵守当地政策和程序,以避免与高温相关的伤害。考虑 MOPP 工作/休息周期和水更换指南 IAW 当前 CBRN 原则。(ATP 3-11.32,化学、生物、放射和核防护的多服务战术、技术和程序)
摘要 - 许多现实世界的应用程序可以作为多机构合作问题,例如网络数据包路由和自动驾驶汽车的协调。深入增强学习的出现(DRL)通过代理和环境的相互作用为多机构合作提供了一种有希望的方法。然而,传统的DRL解决方案在策略搜索过程中遭受了具有连续动作空间的多个代理的高维度。此外,代理政策的动态性使训练非平稳。为了解决这些问题,我们建议采用高级决策和低级个人控制,以进行有效的政策搜索。特别是,可以在高级离散的动作空间中学习多种代理的合作。同时,低级个体控制可以减少为单药强化学习。除了分层增强学习外,我们还建议对手建模网络在学习过程中对其他代理的政策进行建模。与端到端的DRL方法相反,我们的方法通过以层次结构将总体任务分解为子任务来降低学习复杂性。为了评估我们方法的效率,我们在合作巷更改方案中进行了现实世界中的案例研究。模拟和现实世界实验都显示了我们在碰撞速度和收敛速度中的优越性。索引条款 - 多机构合作;深入的强化学习;分层增强学习
解决不同领域和模态的复杂 AI 任务是迈向通用人工智能的关键一步。虽然有许多适用于各种领域和模态的 AI 模型,但它们无法自主处理复杂的 AI 任务。考虑到大型语言模型 (LLM) 在语言理解、生成、交互和推理方面表现出卓越的能力,我们主张 LLM 可以充当控制器来管理现有的 AI 模型以解决复杂的 AI 任务,而语言则充当通用接口来支持这一点。基于这一理念,我们提出了 HuggingGPT,这是一个由 LLM 驱动的代理,它利用 LLM(例如 ChatGPT)连接机器学习社区(例如 Hugging Face)中的各种 AI 模型来解决 AI 任务。具体来说,我们使用 ChatGPT 在收到用户请求时进行任务规划,根据 Hugging Face 中可用的功能描述选择模型,使用选定的 AI 模型执行每个子任务,并根据执行结果总结响应。 HuggingGPT借助ChatGPT强大的语言能力和Hugging Face丰富的AI模型,可以解决跨不同模态和领域的各种复杂AI任务,并在语言、视觉、语音等挑战性任务中取得令人瞩目的成果,为实现通用人工智能开辟了一条新途径。
近年来,生成人工智能(GenAI)在金融分析和投资决策中的应用引起了广泛关注。然而,大多数现有方法依赖于单智能体系统,无法充分利用多个AI智能体的协作潜力。在本文中,我们提出了一种新颖的多智能体协作系统,旨在增强金融投资研究中的决策能力。该系统将具有可配置组大小和协作结构的智能体组结合起来,以利用每种智能体组类型的优势。通过利用次优组合策略,系统可以动态适应不同的市场条件和投资场景,从而优化不同任务的性能。我们通过分析道琼斯指数中 30 家公司的 2023 年 SEC 10-K 表格,重点关注三个子任务:基本面、市场情绪和风险分析。我们的研究结果表明,基于针对不同任务的 AI 代理的配置,性能存在显著差异。结果表明,我们的多代理协作系统优于传统的单代理模型,在复杂的金融环境中具有更高的准确性、效率和适应性。这项研究强调了多代理系统通过整合不同的分析视角来转变财务分析和投资决策的潜力。
汽车驾驶被认为是一项非常复杂的活动,由不同的伴随任务和子任务组成,因此了解不同因素(例如道路复杂性、交通、仪表盘设备和外部事件)对驾驶员行为和表现的影响至关重要。因此,在特定情况下,驾驶员的认知需求可能非常高,导致过度的心理负荷,从而增加犯错概率。在这方面,已经证明人为错误是 57% 道路事故的主要原因,也是大多数事故的促成因素。在这项研究中,20 名年轻受试者参与了一项真实驾驶实验,该实验在不同的交通条件下(高峰时段和非高峰时段)和不同的道路类型(主干道和次要街道)进行。此外,在驾驶任务期间,还发生了不同的特定事件,特别是行人过马路和汽车在实验对象前方进入交通流。已采用基于驾驶员脑电图 (EEG)(即大脑活动)的工作负荷指数来调查不同因素对驾驶员工作负荷的影响。还采用了眼动追踪 (ET) 技术和主观测量,以便全面了解驾驶员感知的工作负荷,并调查从所采用的方法中获得的不同见解。
摘要:执行功能障碍代表帕金森氏病(PD)中常见的非运动症状,对日常功能和生活质量产生了重大负面影响。因此,使用生态工具评估行政职能(EFS)至关重要。传统神经心理学测试的生态局限性导致虚拟现实和360◦基于环境的工具的使用增加,以评估现实生活中的EFS。这项研究旨在评估执行功能创新工具360◦(出口360°)的效率和可用性,这是一种基于360◦基于PD评估EFS的工具。25个患有PD和25个健康对照组(HC)的人将通过常规的神经心理学电池进行评估,并通过头部安装显示器交付360◦出口。出口360◦将显示出复杂性增加的国内场景和七个不同的子任务,并将收集口头反应,反应时间和生理数据。我们预计将判断出360◦将被判断为可用,引人入胜且具有挑战性。此外,我们希望找到高度收敛的(常规测试和出口360°)和诊断有效性(PD与HC的个体)。出口360的验证将允许采用快速,生态和有用的PD筛查工具,可能会改变诊所和患者的评估。
摘要。我们提出了一种新颖的提示范式 DetToolChain,以释放多模态大型语言模型 (MLLM)(例如 GPT-4V 和 Gemini)的零样本物体检测能力。我们的方法包括一个受高精度检测先验启发的检测提示工具包和一个用于实现这些提示的新思路链。具体来说,工具包中的提示旨在引导 MLLM 关注区域信息(例如放大)、根据测量标准读取坐标(例如叠加尺子和圆规)以及从上下文信息中进行推断(例如叠加场景图)。基于这些工具,新的检测思路链可以自动将任务分解为简单的子任务,诊断预测并规划渐进式框细化。我们的框架的有效性在一系列检测任务中得到了证明,尤其是在困难情况下。与现有的最先进方法相比,使用我们的 DetToolChain 的 GPT-4V 可将最先进对象检测器的 AP 50 在 MS COCO Novel 类集(用于开放词汇检测)上提高 21.5%,在 RefCOCO val 集(用于零样本指称表达理解)上提高 24.23%,在 D-cube 描述对象检测 FULL 设置上提高 14.5% AP。代码将在接受后发布。
环境:环境保护不仅是法律,也是正确做法。这是一个持续的过程,从深思熟虑的规划开始。在训练和执行任务期间,始终注意保护环境的方法。这样做,您将为维持我们的训练资源做出贡献,同时保护人类和环境免受有害影响。请参阅当前的《环境注意事项》手册和当前的 GTA 环境相关风险评估卡。电池充电操作期间可能会排放危险烟雾或气体。确保工作区域通风良好。请勿在充电电池附近吸烟或明火;排出的气体可能会爆炸。请勿尝试为损坏或漏液的电池充电。内部和外部电池组不应以以下方式处理:1) 请勿将其丢弃在火中。2) 不要短路。3) 根据国防部手册 4160.21M1 将电池送回国防再利用和营销办公室进行处置。安全:在训练环境中,领导者必须根据当前的风险管理原则进行风险评估。领导者将根据训练与条令司令部安全官的要求,在计划和完成每项任务和子任务时,通过评估任务、敌人、地形和天气、部队和支援可用时间以及民事考虑因素(METT-TC)来完成当前的深思熟虑风险评估工作表。