随着视觉变换器 (ViT) 的巨大成就,基于变换器的方法已成为解决各种计算机视觉任务的新范式。然而,最近的研究表明,与卷积神经网络 (CNN) 类似,ViT 仍然容易受到对抗性攻击。为了探索不同结构模型的共同缺陷,研究人员开始分析跨结构对抗性迁移能力,而这方面仍未得到充分研究。因此,在本文中,我们专注于 ViT 攻击,以提高基于变换器和基于卷积的模型之间的跨结构迁移能力。先前的研究未能彻底调查 ViT 模型内部组件对对抗性迁移能力的影响,导致性能较差。为了克服这个缺点,我们开展了一项激励研究,通过线性缩小 ViT 模型内部组件的梯度来分析它们对对抗性迁移能力的影响。基于这项激励研究,我们发现跳跃连接的梯度对迁移能力的影响最大,并相信来自更深块的反向传播梯度可以增强迁移能力。因此,我们提出了虚拟密集连接方法(VDC)。具体来说,在不改变前向传播的情况下,我们首先重构原始网络以添加虚拟密集连接。然后,在生成对抗样本时,我们通过虚拟密集连接反向传播更深层注意力图和多层感知器(MLP)块的梯度。大量实验证实了我们提出的方法优于最先进的基线方法,ViT模型之间的可迁移性提高了8.2%,从ViT到CNN的跨结构可迁移性提高了7.2%。
强化学习(RL)可以将语言模型与非不同的奖励信号(例如人类偏好)相结合。但是,这些奖励信号的稀疏性引起了一个重大挑战 - 通常,整个输出只有一个奖励。这种奖励的稀疏性会导致学习效率低下和不稳定的学习。为了应对这一挑战,我们的论文介绍了一个新颖的框架,该框架利用大型语言模型(LLM)的批评能力在RL培训期间产生中间步骤奖励。我们的方法将一个循环模型与批评语言模型配对,该模型可为策略输出的每个部分提供反馈。然后将此反馈转换为可用于指导RL训练过程的令牌或跨度奖励。我们在两个不同的设置下投资了这种方法:一种政策模型较小,并与更强大的评论家模型配对,而单一语言模型则履行两个角色的另一个。我们评估了三个文本生成任务的方法:情感控制,语言模型排毒和摘要。的结果表明,在自动评估和人类评估的支持下,纳入了人造的内在奖励可以显着提高样本效率和策略模型的整体绩效。该代码可在Google Research Github *下获得。
摘要 - 虽然自动驾驶的能力已迅速发展,但融合到密集的交通仍然是一个重大挑战,但已经提出了许多针对这种情况的运动计划方法,但很难对其进行评估。大多数现有的闭环模拟器依赖于其他车辆的基于规则的控件,这导致缺乏多样性和随机性,因此无法准确评估高度交互式场景中的运动计划能力。此外,传统的评估指标不足以全面地评估密集流量合并的性能。回应,我们提出了一个闭环评估基准,用于评估合并方案的运动计划功能。我们的方法涉及在大规模数据集中训练的其他车辆,具有微观行为特征,可显着提高复杂性和多样性。此外,我们通过利用大型语言模型来评估每种自动驾驶汽车合并到主要道路上来重组评估机制。广泛的实验证明了该评估基准的高级性质。通过此基准,我们获得了对存在方法的评估并确定了常见问题。我们设计的环境和车辆运动计划模型可以通过https://anonymon.4open.science/r/ bench4merge-eb5d访问。
1.引言 干旱是指由于降水突然减少而导致水和土壤水分严重短缺,从而导致水资源供应不足和农作物减产。在印度次大陆,干旱通常是由于西南季风延迟到来和/或提前撤退,并伴有降水不足而发生的 [1]。虽然降水不足是干旱的一个驱动力,但热浪导致的异常气温上升也会引发和加剧干旱 [2]。降水不足和极端高温共同导致的干旱更加严重,对农业造成的破坏更大,导致农作物产量大幅下降,就像 2003 年欧洲的情况一样 [3]。干旱和半干旱气候地区更容易发生干旱,因为它们对降水不足和极端温度更敏感。降雨和温度都可能在干旱的发生、发展和持续中发挥重要作用,尤其是对于植被和农业干旱。热浪被定义为空气和地表温度的突然升高,连续几天高于正常值(长期平均值)。印度的热浪发生在夏季或季风前期(4 月至 5 月)以及 6 月初雨季开始时。此类热浪通常
我们提出了一种方法,以解决从新一代共享内存NUMA架构的出现中得出的可编程性问题。为此,我们采用了密集的矩阵因子化和矩阵反转(DMFI)作为用例,并且我们针对两种现代体系结构(AMD Rome和Huawei Kunpeng 920),它们表现出了可配置的Numa拓扑。我们的方法论通过为DMFI提出多域的实现以及混合任务和循环级并行化来追求各个不同的NUMA配置的性能可移植性,以配置多线程执行,以在核心到达核心绑定,从而利用核心固定型绑定,并以较小的代码进行限制。此外,我们还介绍了DMFI多域实现的概括,该实现几乎支持当前和未来体系结构中的任何NUMA拓扑。我们对三个代表性密集的线性代数操作的两个目标架构进行的实验验证了该提案,揭示了有关调整代码及其执行以改善数据访问区域的必要性的见解,并报告跨架构以及与固定的数字竞争的构建和内部互动竞争的群体相关联,以实现的范围,以实现距离,以实现范围,以实现距离,以实施欧元,以实现距离,以实施欧元,以实施欧元,以实现距离,以实施欧元,以实现距离,以实现距离,并将其竞争性地融合到脉络上,并涉及群体的范围,以实现距离,并将其与范围内的脉络相关联。 编程。
摘要:热带森林具有极为丰富的植物多样性,但其特征描述仍不完整,部分原因是现场评估的资源密集度。遥感技术可以提供有价值、经济高效、大规模的见解。本研究调查了机载激光雷达和成像光谱的结合使用,以在法属圭亚那的景观尺度上绘制树种图。使用线性判别分析 (LDA)、正则化判别分析 (RDA) 和逻辑回归 (LR) 为 20 个物种中的每一个开发了二元分类器。用短波红外 (SWIR) 波段补充可见光和近红外 (VNIR) 光谱带可将目标物种的平均分类准确率从 56.1% 提高到 79.6%。增加非焦点物种的数量会降低目标物种识别的成功率。只要使用适当的标准来调整阈值概率分配,分类性能就不会受到非焦点类别中的杂质率(分配类别之间的混淆)的显著影响(偏差高达 5%)。每个物种类别中有限的树冠数量(30 个树冠)足以有效地检索正确的标签。在 1.5 公顷的分辨率下,目标物种的总冠层面积与 118 公顷的基部面积密切相关,这表明该方法的操作应用具有现实的前景(六种主要商业树种的 R 2 = 0.75)。
在我们最近的工作11中,我们引入了一种基于离散优化的密集图像配准方法,即带有 α 扩展的最小图割。12 其他人之前已经提出过使用最小图割进行图像配准,13、14 但由于该方法的计算成本高,在实践中采用有限。通过将图像划分为子区域,并将每个 α 扩展一次限制在一个子区域,我们能够大幅减少这种配准方法的计算时间,而质量方面仅有很小的损失。处理一个子区域涉及两个步骤:计算体素匹配标准(即构建图形)并通过求解最小图割问题执行离散优化。早期的分析实验表明,对于较小的子区域,大部分计算时间都花在计算匹配标准上,而不是执行图割优化上。当使用计算密集度更高的相似性度量(例如互相关 (CC))时,这种效果更加明显,这已被证明在图像配准中很有价值。15
图 1:信息子图提取的动机:(a)演示了从群体水平连接组数据中获取边推理矩阵的过程;(b)说明常用的社区检测结果(例如使用随机块模型)无法检测到任何信息子图;(c)显示现有密集子图发现结果的结果;(d)描述了一种理想的信息子图检测程序,该程序可以识别由信息边组成的有组织的、生物学上可解释的拓扑结构。(d)中的结果基于 ADSD 方法(详细信息请参阅结果部分)。
尽管Vision Transformer(VIT)在计算机视觉方面取得了显着的成功,但由于缺乏内部绘制互动和特征量表的多样性有限,它在密集的预测任务中表现不佳。大多数现有的研究致力于设计视觉特定的变压器来解决上述问题,从而涉及额外的培训前成本。因此,我们提出了一种普通的,无培训的且具有特征增强的vit背骨,并具有指定性的特征性动作,称为Vit-Comer,可促进CNN和Transformer之间的双向相互作用。与现状相比,VIT-COMER具有以下优点:(1)我们将空间金字塔多触发性场卷积特征注入VIT体系结构,从而有效地减轻了VIT中局部信息相互作用和单场表述的有限问题。(2)我们提出了一个简单有效的CNN转换器双向交互模块,该模块在跨层次特征上执行多尺度融合,这对Han-dling密集的预测任务有益。(3)我们评估了在各种密集的预测任务,不同框架和多个高级预训练中VIT-COMER的能力。值得注意的是,我们的VIT-COMER-L在没有额外训练数据的情况下可可Val2017上的AP达到64.3%,而ADE20K Val上的MIOU为62.1%,这两种方法都与最先进的方法相当。我们希望VIT-COMER可以作为密集预测任务的新骨干,以促进未来的研究。该代码将在https://github.com/traffic-x/vit-comer上发布。