简介:自由放养的白尾鹿(Odocoileus virginianus)是位于密歇根州东北部(美国)的牛结核病(BTB)的自我维持的水库,(美国)不断使该地区的牛业陷入困境。自由娱乐鹿的收获,诱饵禁令和农场的缓解措施减少了但没有消除鹿的BTB,也没有消除向牛的传播。鹿的明显患病率很低(1-2%),但恒定,疫苗接种可能是帮助解决该问题和值得研究的附加工具。结核分枝杆菌Calmette-guérin(BCG)疫苗是一种广泛使用的人类疫苗用于结核病,在家庭牲畜和野生动植物中也接受了很好的研究。它是主要的疫苗候选者,口服输送是将其交付给自由放养鹿的逻辑手段,尽管以前从未尝试过。
合作的异构多智能体任务要求智能体以灵活和互补的方式行事,以最大限度地利用其多样化的能力。针对这一挑战的基于学习的解决方案涵盖两个端点之间的范围:i)共享参数方法,通过为每个智能体分配一个 ID,在单一架构内编码不同的行为,这种方法具有样本效率,但行为多样性有限;ii)独立方法,为每个智能体学习单独的策略,以样本和参数效率为代价实现更大的多样性。先前针对异构多智能体团队的学习工作已经通过学习智能体类别的共享参数或独立策略探索了这一范围的中间地带,从而允许在多样性和效率之间进行折衷。然而,这些方法仍然没有推理智能体能力对行为的影响,因此不能推广到看不见的智能体或团队组成。受到最近迁移学习和元强化学习研究的启发,并在基于特征的任务分配的先前研究的基础上,我们提出了能力感知共享超网络 (CASH),这是一种用于异构协调的新型软权重共享架构,它使用超网络明确推理持续代理能力和局部观察。直观地说,CASH 允许团队学习共享的决策策略(由共享编码器捕获),这些策略可以通过共享超网络根据团队的个人和集体能力轻松调整。我们对两个异构协调任务和三个标准学习范式(模仿学习、基于价值和策略梯度强化学习)进行了详细的实验,展示了我们的设计如何与底层学习范式无关。结果表明,CASH 生成了适当多样化的行为,在训练和零样本泛化过程中,其任务性能和样本效率始终优于基线架构。值得注意的是,CASH 仅使用基线使用的可学习参数的 20% 到 40% 就实现了这些改进。我们所有的代码都可以在 https://github.com/kfu02/JaxMARL 上找到。
合作性异构多智能体任务要求智能体以灵活和互补的方式行事,以最大程度地利用其多样化能力。针对这一挑战的基于学习的解决方案涵盖两个端点之间的范围:i)共享参数方法,通过为每个智能体分配一个 ID,在单一架构内编码多样化行为,这种方法样本效率高,但行为多样性有限;ii)独立方法,为每个智能体学习单独的策略,以样本和参数效率为代价实现更大的多样性。先前针对异构多智能体团队学习的研究已经探索了这一范围的中间地带,即为不同类别的智能体学习共享参数或独立策略,从而在多样性和效率之间实现折衷。然而,这些方法仍然没有推理智能体能力对行为的影响,因此不能推广到未知的智能体或团队组成。受到迁移学习和元强化学习最新研究的启发,并在基于特征的任务分配的先前研究的基础上,我们提出了能力感知共享超网络 (CASH),这是一种用于异构协调的新型软权重共享架构,它使用超网络明确推理持续代理能力和局部观察。直观地说,CASH 允许团队学习共享的决策策略(由共享编码器捕获),这些策略可以通过共享超网络根据团队的个人和集体能力轻松调整。我们在两个异构协调任务和三个标准学习范式(模仿学习、基于价值和策略梯度强化学习)中进行了详细的实验,展示了我们的设计如何与底层学习范式无关。结果表明,CASH 产生了适当多样化的行为,在训练和零样本泛化期间的任务性能和样本效率方面始终优于基线架构。值得注意的是,CASH 仅使用基线使用的 20% 到 40% 的可学习参数就实现了这些改进。我们所有的代码都可以在 https://github.com/kfu02/JaxMARL 上找到。
链球菌后自身免疫性神经精神疾病(PANDAS)是一组病理状况,其特征是在β-溶血性链球菌A(GAS)感染后突然发作的强迫症和TIC疾病(GAS)感染,该疾病(GAS)感染(GAS)受到自身免疫机械的攻击,该基础是基础机构的,该疾病是由基础机构降低的。文献很少,但是很少有研究支持以下假设:链球菌感染可能会改变这些患者的肠道微生物群成分,从而导致慢性炎症,从而影响大脑功能和行为。显着的变化包括减少的微生物多样性和细菌种群的转移,这会影响对神经炎症至关重要的代谢功能。SNOX2-DP和异丙烷的血清水平升高表明氧化应激,而脂多糖(LPS)的存在可能有助于神经炎症。本叙事评论的目的是探索大熊猫和肠道菌群组成之间的联系。大熊猫中肠道菌群与神经精神症状之间的潜在联系可能表明饮食干预措施的重要性,例如促进地中海饮食和纤维摄入,以减少患者的炎症状态,从而改善其结果。
摘要 - 为了实现复杂的现实世界利用任务的自主权,我们考虑为具有异质自治能力的机器人团队的部署策略。在这项工作中,我们制定了一个多机器人勘探任务,并计算一项操作政策,以维持机器人团队的生产率并最大程度地提高任务奖励。环境描述,机器人能力和任务结果被建模为马尔可夫决策过程(MDP)。我们还包括实地世界操作中的限制,例如传感器故障,有限的沟通覆盖范围和移动性压力元素。然后,我们在DARPA地下(Subt)挑战的背景下研究了现实情况下提出的操作模型。在SubT挑战的最终竞争中,计算出的部署政策还与基于人类的操作策略进行了比较。最后,使用拟议的模型,我们讨论了建立具有异质功能的多机器人团队的设计权衡。
大型语言模型 (LLM) 极大地推进了自然语言处理范式。然而,高计算负荷和巨大的模型大小对在边缘设备上的部署提出了巨大挑战。为此,我们为 LLM 提出了 APTQ(注意感知训练后混合精度量化),它不仅考虑了每层权重的二阶信息,而且首次考虑了注意输出对整个模型的非线性影响。我们利用 Hessian 迹作为混合精度量化的敏感度指标,确保在保留模型性能的情况下进行明智的精度降低。实验表明,APTQ 超越了之前的量化方法,在 C4 数据集中实现了平均 4 位宽度和 5.22 困惑度,几乎相当于全精度。此外,APTQ 在 LLaMa-7B 和 LLaMa-13B 中分别以平均 3.8 的位宽实现了 68.24% 和 70.48% 的最佳零样本准确率,证明了其生成高质量量化 LLM 的有效性。