强化学习(RL)可以将语言模型与非不同的奖励信号(例如人类偏好)相结合。但是,这些奖励信号的稀疏性引起了一个重大挑战 - 通常,整个输出只有一个奖励。这种奖励的稀疏性会导致学习效率低下和不稳定的学习。为了应对这一挑战,我们的论文介绍了一个新颖的框架,该框架利用大型语言模型(LLM)的批评能力在RL培训期间产生中间步骤奖励。我们的方法将一个循环模型与批评语言模型配对,该模型可为策略输出的每个部分提供反馈。然后将此反馈转换为可用于指导RL训练过程的令牌或跨度奖励。我们在两个不同的设置下投资了这种方法:一种政策模型较小,并与更强大的评论家模型配对,而单一语言模型则履行两个角色的另一个。我们评估了三个文本生成任务的方法:情感控制,语言模型排毒和摘要。的结果表明,在自动评估和人类评估的支持下,纳入了人造的内在奖励可以显着提高样本效率和策略模型的整体绩效。该代码可在Google Research Github *下获得。
我们是否充分利用多模式大语模型(MLLM)中视觉编码器的潜力?MLLM最近在多模式理解中的出色表现引起了学术界和行业的广泛关注。在当前的MLLM大鼠种族中,重点似乎主要是语言方面。我们目睹了较大和更高质量的指导数据集的兴起,以及大型LLM的参与。然而,很少关注的注意力指向MLLM使用的视觉信号,通常被认为是冷冻视觉编码器提取的最终高级特征。在本文中,我们介绍了密集的连接器 - 一种简单,有效且插件的视觉语言连接器,通过利用多层视觉特征来显着增强现有MLLM,并以最少的额外计算开销。在此基础上,我们还提出了有效的密集连接器,该连接器的性能与Llava-V1.5相当,只有25%的视觉令牌。此外,我们的模型仅在图像上进行了训练,还展示了视频理解中出色的零拍功能。各种视觉编码器,图像分辨率,训练数据集量表,不同尺寸的LLM(2.7b→70b)以及MLLM的不同架构(e。g。,llava-v1.5,llava-next和mini-gemini)验证了我们方法的多功能性和可扩展性,从而在19个图像和视频基准中实现了最先进的性能。我们希望这项工作将提供宝贵的经验,并成为未来MLLM开发的基本模块。代码可在https://github.com/hjyao00/denseconnector上找到。
摘要 — 有效学习脑电图 (EEG) 信号中的时间动态具有挑战性,但对于使用脑机接口 (BCI) 解码大脑活动至关重要。尽管 Transformers 因其长期顺序学习能力在 BCI 领域广受欢迎,但大多数将 Transformers 与卷积神经网络 (CNN) 相结合的方法都无法捕捉 EEG 信号从粗到细的时间动态。为了克服这一限制,我们引入了 EEG-Deformer,它将两个主要的新组件合并到 CNN-Transformer 中:(1) 分层粗到细 Transformer (HCT) 块,将细粒度时间学习 (FTL) 分支集成到 Transformers 中,有效辨别从粗到细的时间模式;(2) 密集信息净化 (DIP) 模块,利用多级、净化的时间信息来提高解码准确性。对三项代表性认知任务(认知注意力、驾驶疲劳和心理负荷检测)进行的全面实验一致证实了我们提出的 EEG-Deformer 的通用性,表明它的表现优于或与现有的最先进方法相当。可视化结果表明,EEG-Deformer 从神经生理学上有意义的大脑区域学习相应的认知任务。源代码可在 https://github.com/yi-ding-cs/EEG-Deformer 找到。
与传统的 2D 计算系统相比,超密集 3D 集成电路(3D IC),例如单片 3D IC(图 1),可以为数据密集型应用带来巨大的能量延迟积(EDP)优势 [1,2]。为了实现这些优势,需要将多层逻辑和存储器(例如,逻辑和/或存储器设备的薄层,以及相关的信号/全局金属布线)以 3D 形式集成,并使用有限长宽比的后端制程(BEOL)层间过孔(ILV)建立超密集(例如,间距 ≤ 100 纳米)垂直连接 [3]。现有的 BEOL 布线结构已经在使用这种纳米级 ILV。3D IC 变得至关重要,因为工艺技术小型化的根本限制使得传统的缩放路径更加困难。但是,必须克服重大的热挑战才能在多个 3D 层上实现高速和高功率计算引擎 [4-5]。如果没有新技术,未来 3D IC 的上层最高温度将大大超过可靠运行所需的上限(例如 [6] 中的 125°C)。我们使用图 1 中的单片 3D IC 来了解 3D 层中的温升和热耗散(详细分析见第 III 部分)。图 1 中的 N 层中的每一层都包含一层高速、高功率硅逻辑器件(例如,计算引擎)和由铜布线和超低κ 层间电介质 (ILD) 组成的 BEOL 层(例如,用于信号布线)。各层通过超密集 ILV 电连接。在某些设计中,每层还存在硅存储器、存储器访问设备和额外的 BEOL。3D IC 由附加的散热器进行外部冷却,散热器将产生的所有热量以散热器比传热系数 h(W/m 2 /K)散发到环境中。最高温度 T j 取决于散热器、环境温度和 N 层的热特性。散热器创新(如 [7])只需散热器上 10°C 的温升(即 h= 10 6 W/m 2 /K)即可消除 1000 W/cm 2 的热量,尽管
在这项研究中,我们在特征纯化和逐渐反向传播过程中检查了通道特征与卷积内核之间的关联,重点是网络内的向前和向后传播。因此,我们提出了一种称为特征空间固化的称为密集的Channel压缩的方法。利用了该方法的中心概念,我们引入了两个用于主链和头部网络的创新模块:特征空间固化结构(DF)的密集通道压缩和不对称的多级压缩解耦头(ADH)。集成到Yolov5模型中时,这两个模块表现出了出色的性能,从而导致修改的模型称为Yolocs。在MSCOCO数据集,大型,中和小型Yolocs模型上评估的AP分别为50.1%,47.6%和42.5%。保持推理速度与
抽象的稀疏奖励和样本效率是增强学习领域的开放研究领域。在考虑对机器人技术和其他网络物理系统的增强学习应用时,这些问题尤其重要。之所以如此,是因为在这些领域中,许多任务都是基于目标的,并且自然而然地表达了二进制成功和失败,动作空间较大且连续,并且与环境的实际相互作用受到限制。在这项工作中,我们提出了深层的价值和预测模型控制(DVPMC),这是一种基于模型的预测增强学习算法,用于连续控制,该算法使用系统识别,值函数近似和基于采样的优化对选择动作。该算法是根据密集的奖励和稀疏奖励任务进行评估的。我们表明,它可以使预测控制方法的性能与密集的奖励问题相匹配,并且在样本效率和性能的指标上,在稀疏奖励任务上优于模型和基于模型的学习算法。我们验证了使用DVPMC训练在仿真的机器人上培训的代理商的性能。可以在此处找到实验的视频:https://youtu.be/ 0q274kcfn4c。
昼夜节律,基础和类固醇分泌的季节性变化与几种哺乳动物物种的脑体积变化有关。然而,人类类固醇激素产生的昼夜节律变化与人类脑形态的节奏变化之间的关系在很大程度上是未知的。在这里,我们研究了类固醇激素中昼夜浮动之间的关系,在一项男性的精确成像研究中,男性在上午7点完成了40次MRI和血清学评估。和晚上8点在一个月的过程中,针对激素浓度在其峰值和Nadir处。昼夜浮动与全球和区域脑形态的明显变化相关。从早晨到晚上,总脑体积,灰质体积和皮质厚度降低,与类固醇激素浓度(睾丸激素,雌二醇和皮质醇)的降低一致。并行,脑脊液和心室尺寸从A.M.到下午全球变化是由枕骨和顶叶皮层内的减少驱动的。这些发现突出了脑形态中的自然节奏,这些节奏与类固醇激素的昼夜潮流和流动保持在一起。
摘要。传统的单对象跟踪任务正在经历新的转型浪潮,尤其是随着语义缺乏的出现,这导致了视觉跟踪任务的兴起。但是,将Vi-Sual Tracker与自然语言描述相结合的先前方法倾向于依靠文本描述的全局表示,而较少考虑文本描述和Vi-Sual外观之间的精细连接。本文提议利用双向交叉注意模块来捕获语言和视觉特征之间的连接,这些连接进一步投影为密集的语义反映以保持对齐方式。为了保持搜索区域与耦合的自然语言之间的语义同意,并使融合功能保持一致,本文提出了一种新颖的密集性对比度学习损失,以弥合文本和视觉方式之间的语义差距,并以密集的形式对齐。所提出的框架在跟踪包含自然语言描述的数据集(例如TNL2K和OTB99-LANG)方面实现了有希望的结果。我们的方法提供了一种新颖的解决方案,用于代表和对齐单个对象跟踪任务的跨模式信息,并可能激发该领域的进一步研究。
脑肿瘤死亡率高,治疗选择有限,是全球重大健康问题。这些肿瘤是由脑内细胞异常生长引起的,大小和形状各异,因此,对于医疗专业人员来说,通过磁共振成像 (MRI) 扫描手动检测它们是一项主观且具有挑战性的任务,因此需要自动化解决方案。本研究探讨了深度学习(特别是 DenseNet 架构)自动化脑肿瘤分类的潜力,旨在提高临床应用的准确性和通用性。我们利用了 Figshare 脑肿瘤数据集,该数据集包含 233 名患者的 3,064 张 T1 加权增强 MRI 图像,这些患者患有三种常见肿瘤类型:脑膜瘤、神经胶质瘤和垂体瘤。使用来自 ImageNet 的迁移学习评估了四种预训练的深度学习模型——ResNet、EfficientNet、MobileNet 和 DenseNet。DenseNet 实现了最高的测试集准确率 96%,优于 ResNet(91%)、EfficientNet(91%)和 MobileNet(93%)。因此,我们专注于提高 DenseNet 的性能,同时将其视为基础模型。为了增强基础 DenseNet 模型的通用性,我们实施了一种微调方法,该方法采用了正则化技术,包括数据增强、dropout、批量归一化和全局平均池化,并结合了超参数优化。这种增强的 DenseNet 模型实现了 97.1% 的准确率。我们的研究结果证明了 DenseNet 结合迁移学习和微调对脑肿瘤分类的有效性,凸显了其在临床环境中提高诊断准确性和可靠性的潜力。
城市化对全球城市构成了重大挑战。到2050年,预计全球70%的全球人口将居住在城市地区,给人类和自然带来新的挑战。在人口稠密的地区,有限的空间和土地利用冲突通常会导致经济增长的优先级,从而导致人类和环境健康的缺点。快速的城市化会加剧不平等,健康问题,社会问题,环境破坏和栖息地丧失。在人口稠密的城市中整合城市性质通常受到高昂的实施成本,密集的管理要求以及在冲突地区普遍缺乏空间的阻碍。尽管如此,联合国和欧盟等组织强调了自然要素在创造健康,宜居和可持续城市中的重要性。