We provide a unified analysis of two-timescale gradient descent ascent (TTGDA) for solving structured nonconvex minimax optimization problems in the form of min x max y ∈Y f ( x , y ), where the objective function f ( x , y ) is nonconvex in x and concave in y , and the constraint set Y ⊆ R n is convex and bounded.在凸 - 孔循环设置中,单次梯度下降(GDA)算法被广泛用于应用中,并且已被证明具有强大的收敛保证。在更一般的设置中,它可能无法收敛。我们的贡献是设计ttgda算法,这些算法是有效的,这些算法超出了凸形 - 连接设置,并有效地确定了函数φ(·)的固定点:= maxy∈Yf(·f(·,y)。我们还建立了解决求解平滑和非平滑concove-concave minimax优化问题的复杂性的理论界限。据我们所知,这是对非凸端优化的TTGDA的第一个系统分析,阐明了其在训练生成的对抗网络(GAN)和其他现实世界应用问题中的卓越性能。关键字:结构化的非凸极最小值优化,两次尺度梯度下降,迭代复杂度分析
抽象的栖息地丧失和破碎化突出了监测栖息地的重要性。对于诸如节肢动物之类的巨大群体,仍在发现许多特殊的群体中,将较高的分类学水平用作多样性的替代品可能是一个有用的工具。这项研究的目的是评估使用基本分类分类决议来评估Laniatores Harvestmen(Arachnida:Opiliones)的丰富性和组成。所选的五种决议如下:属,家族,下属,指标分类单元和中间分辨率(属和物种鉴定水平的组合)。此外,我们评估了Di-Cersity替代品是否提供了纬度梯度的良好估计。在巴西东北部的纬度梯度沿线的十九个大西洋森林地点进行了采样。我们共记录了88种收获物种/形态种类,分布在7个家庭,15个亚家族和36属中。属和中间分辨率是收获物种丰富度的出色替代品。效率与所使用的替代分辨率不同。四种决议足以替代收割者组成:属,中间分辨率,指标分类群和亚家族。记录的收获物种的数量在季节性半凝结森林和哥斯群岛大西洋雨林之间有显着差异。当我们考虑属和中间分辨率时,也观察到相同的关系也观察到相同的关系。我们的结果表明,将属用作收割者的丰富度和成分替代,以降低监视成本,并以较短的时间和更实用的方式提供评估。
可以测量水平梯度。通过在智能网格算法中利用测量的水平梯度,可以显著改善磁体的空间定位。因此,可以更好地分辨横向连续的地平线。此外,梯度增强可以显著提高与飞行方向平行或次平行的磁特征的分辨率,如右下图所示。使用 MIDAS 的优势 MIDAS 的优势包括:
具有不完整输入数据(缺少模态)的多模式学习是实用且具有挑战性的。在这项工作中,我们对这一挑战进行了深入的分析,发现模式优势对模型训练具有显着的负面影响,从而极大地降低了缺失的模态性能。是由Grad-CAM激励的,我们引入了一种新颖的指标,梯度,以监测和减少在缺失情景中广泛存在的模态主导性。为了帮助该指标,我们提出了一种新颖的梯度引导的模态解耦(GMD)方法,以促进对主导方式的依赖性。特定的是,GMD从不同模态中删除了冲突的梯度成分,以实现这种去耦,从而显着提高了性能。此外,要弹性处理模态分配数据,我们设计了一个参数有效的动态共享(DS)框架,该框架可以根据是否可用,可以根据是否可用来求解网络参数。我们对三个流行的多模式基准进行了广泛的实验,包括Brats 2018用于医学分割,CMU-MOSI和CMU-MOSEI进行情感分析。结果表明,我们的方法可以显着胜过竞争对手,表明所提出的解决方案的有效性。我们的代码在此处发布:https://github.com/haowang420/gradient-gendient-gudide-modality-decoupling。
非局部性是量子物理学的重要组成部分,是量子状态(例如纠缠)许多引人注目的特征的核心。高度纠缠的量子状态的一个重要类别是Greenberger-Horne-Zeilinger(GHz)状态,它们在各种基于量子的技术中扮演关键角色,并且特别感兴趣地基于噪音量子硬件进行基准测试。一种新型的量子启发的生成模型被称为天生机器,该模型利用量子物理的概率性质,在学习经典数据和量子数据方面取得了巨大的成功。为此,我们研究了训练天生机器在张量网络的两个不同架构上学习GHz状态的任务。我们的结果表明,基于梯度的训练方案对TN BORN机器无法学习GHz状态相干叠加(或平等)的非本地信息。这导致了一个重要的问题,即哪种建筑设计,初始化和优化方案更适合学习隐藏在量子状态中的非本地信息,以及我们是否可以适应量子启发的培训算法以学习此类量子状态。
摘要 - 深度学习中的Multi-Obigntive优化(MOO)旨在同时优化多个相互冲突的目标,这是在多任务学习和多标准学习等领域经常遇到的挑战。基于梯度的MOO方法的最新进展使发现了各种类型的解决方案,从单个平衡解决方案到有限的或什至是无限的帕累托集,并根据用户需求量量身定制。这些发展在跨领域(例如增强学习,计算机愿景,推荐系统和大语言模型)的领域都有广泛的应用。本调查提供了对深度学习中基于梯度的MOO的首次全面综述,涵盖算法,理论和实际应用。通过统一各种方法并确定关键挑战,它是推动这一不断发展的领域创新的基础资源。深度学习中MOO算法的全面列表可在https://github.com/baijiong-lin/awesome-multi-obigntive-deep-learning上找到。
基于模型的增强学习(MBRL)是一种获得控制策略的样本有效技术,但不可避免的建模误差通常会导致性能恶化。MBRL中的模型通常仅用于重建动态,尤其是状态观察,而模型误差对策略的影响并未由培训目标捕获。这导致MBRL的目标目标之间的不匹配,实现良好的政策和价值学习,以及实践中采用的损失函数的目标,未来的国家预测。天真的直觉表明,价值感知的模型学习将解决这个问题,实际上,已经基于理论分析提出了针对该客观不匹配问题的第二种解决方案。但是,在实践中,它们往往不如通常使用的最大可能性(MLE)方法。在本文中,我们提出了价值梯度加权模型损失(VAGRAM),这是一种新颖的价值模型学习方法,可改善MBRL在具有挑战性的环境中的性能,例如小型模型容量和分散注意力的状态尺寸。我们分析了MLE和值感知的方法,并演示了他们如何在学习价值吸引模型时无法解释样本覆盖范围和功能近似的行为。fom,我们强调了在深度学习环境中稳定优化的其他目标。为了实现这一目标,我们利用经验值函数的梯度作为对RL算法对模型误差的敏感性的量度。我们通过表明我们的损失函数能够在Mujoco基准套件上获得高回报来验证我们的分析,同时比基于最大似然的方法更健壮。
尽管对文本和图像数据进行了深度学习的成功,但基于树的集合模型仍然是使用异质表格数据的机器学习的最新。但是,由于其高灵活性,因此非常需要基于表格的基于梯度的方法。在本文中,我们提出了Grande,Gra Die n t-d ecision树E nSembles,这是一种使用端到端梯度下降的努力学习的新方法。Grande是基于树形合奏的密集表示,该代表允许使用直线操作员使用backpropaga,以共同优化所有模型参数。我们的方法结合了轴对齐的分裂,这是对TAB-ular数据的有用电感偏差,并具有基于梯度的优化的灵活性。此外,我们引入了一个高级实例的加权,以促进单个模型中简单和复杂关系的学习代表。我们对预定义的基准进行了广泛的评估,并与19个分类数据集进行了广泛的评估,并证明我们的方法在大多数数据集上都优于现有的梯度增强和深度学习框架。该方法可在:https://github.com/s-marton/grande