摘要 - 这项研究通过探索着重于定义概括限制和确保收敛性,深入研究元增强学习(meta rl)。通过采用一种方法,本文介绍了一个创新的理论框架,以精心评估元rl算法的有效性和性能。我们提出了概括限制的解释,以测量这些算法能够适应学习任务的同时保持一致的结果。我们的分析探讨了影响元素设计和任务复杂性之间关系的元素适应性的因素。另外,我们通过证明条件确保了荟萃策略可以融合解决方案,从而建立了融合。我们研究了跨场景中元算法的收敛行为,从而对其长期表现背后的驱动力有了全面的理解。此探索涵盖了有关这些算法的能力的融合和实时效率。索引术语 - meta-formentions学习,理论分析,概括约束,收敛保证
当前的学习模型通常难以实现像人类一样的系统泛化,特别是在从有限的数据中学习组合规则并将它们推断为新的组合时。我们引入了神经符号递归机(NSR),其核心是根基符号系统(GSS),允许直接从训练数据中产生组合语法和语义。NSR采用模块化设计,集成了神经感知、句法分析和语义推理。这些组件通过一种新颖的演绎-溯因算法进行协同训练。我们的研究结果表明,NSR的设计充满了等变性和组合性的归纳偏差,使其具有良好的表现力,可以熟练地处理各种序列到序列任务并实现无与伦比的系统泛化。我们在四个旨在探测系统泛化能力的具有挑战性的基准上评估了NSR的有效性:用于语义分析的SCAN、用于字符串操作的PCFG、用于算术推理的HINT和组合机器翻译任务。结果证实了 NSR 在泛化和可转移性方面优于当代神经和混合模型。
对抗训练是一种鲁棒性模型来防止对抗攻击的流行方法。但是,它表现出比在干净输入的训练要严重得多的。在这项工作中,我们从培训实例的角度(即训练输入目标对)研究了这种现象。基于训练集中实例相对困难的定量度量,我们分析了该模型在不同难度水平的训练实例上的行为。这使我们证明,对抗训练的概括性能衰减是拟合硬对抗实例的结果。我们从理论上验证了线性和一般非线性模型的观察结果,证明了在硬实例上训练的模型的概括性能要比在简单实例上接受培训的模型要差,并且这种概括差距随着对抗性预算的规模而增加。最后,我们调查了在几种情况下减轻对抗性过度插入的解决方案,包括快速的对抗训练和使用其他数据进行预处理的模型。我们的结果表明,使用训练数据可自动提高模型的鲁棒性。
自动睡眠分期对于睡眠评估和疾病诊断至关重要。大多数现有方法依赖于一个特定的数据集,并且仅限于推广到其他看不见的数据集,这些数据集的训练数据和测试数据来自同一数据集。在本文中,我们将领域泛化引入自动睡眠分期并提出可泛化的睡眠分期任务,旨在提高模型对看不见的数据集的泛化能力。受现有领域泛化方法的启发,我们采用特征对齐的思想并提出一个名为 SleepDG 的框架来解决它。考虑到局部显着特征和序列特征对于睡眠分期都很重要,我们提出了一种结合时代级和序列级特征对齐的多级特征对齐来学习领域不变的特征表示。具体来说,我们设计了一个 Epoch 级特征对齐来对齐不同域之间每个单个睡眠时期的特征分布,并设计了一个 Sequence 级特征对齐来最小化不同域之间序列特征的差异。SleepDG 在五个公共数据集上进行了验证,实现了最先进的性能。
摘要 - 视觉探测器(VO)对于自主系统的导航至关重要,以合理的成本提供准确的位置和方向估计。虽然传统的VO方法在某些条件下脱颖而出,但它们会面临诸如可变照明和运动模糊之类的挑战。深度学习的VO虽然更适应性,但在新环境中可能会面临概括问题。解决这些缺点时,本文提出了一种新型的混合视觉探光(VO)框架,该框架利用了姿势的超级视觉,提供了稳健性和对广泛标签的需求之间的平衡解决方案。我们提出了两种具有成本效益和创新的设计:一种自我监管的同谱预训练,用于从唯一的姿势标签中增强光流学习,以及一个随机的基于贴片的显着点检测策略,以进行更准确的光流贴片提取。这些设计消除了对训练的密集光流标签的需求,并显着提高了系统在多样化和挑战性环境中的概括能力。与密集的光学流程监督最终的最新方法相比,在极端和看不见的情况下,在极端和看不见的情况下,在标准数据集以及更大的鲁棒性和概括能力上实现了竞争性能。
自动睡眠分期对于睡眠评估和疾病诊断至关重要。大多数现有的方法取决于一个特定的数据集,并且仅限于将培训数据和测试数据来自同一数据集的其他看不见的数据集。在本文中,我们将DO-MAIR REMALITION引入自动睡眠阶段,并提出了可推广的睡眠阶段的任务,该任务旨在证明模型的概括能力是看不见的数据集。通过现有域概括方法刺激,我们采用了特征对齐想法,并提出了一个称为SleepDG的框架来解决它。考虑到局部显着的功能和顺序特征对于睡眠停滞很重要,我们提出了一个多级特征对齐组合,将epoch级级别和序列级特征级别对齐组合来学习域不变的特征表示。具体而言,我们标志着一个阶段级特征对齐,以使每个单个睡眠时期的特征分布在不同的操作中的特征分布以及一个序列级特征对齐,以最大程度地减少不同do-ains之间顺序特征的差异。SleepDG在五个公共数据集上得到了验证,从而实现了最先进的性能。
这项工作继续了我们对互齐次函数 (MHF) 的性质的研究,互齐次函数是欧拉齐次函数的推广。MHF 可用于合成具有特殊性质的电子系统和离子光学系统的电场和磁场。我们考虑了对应于 MHF 基本函数关系矩阵的多个实特征值的函数链。我们推导出了响应此类函数的函数关系。我们推导出了所得函数关系解的一般公式。我们证明了所得函数是 Gel'fand 引入的相关齐次函数的细化。我们研究了所得函数的典型微分和积分性质,并证明了可微函数的欧拉定理的推广(欧拉标准)。