在计算最佳策略时使用较短的计划范围的折扣正则化是一个流行的选择,可以避免面对稀疏或嘈杂的数据时过度使用。通常将其解释为脱颖而出或忽略延迟的影响。在本文中,我们证明了折扣正则化的两种替代观点,这些观点暴露了意外后果并激发了新颖的正则化方法。在基于模型的RL中,在较低的折现因子下计划的行为就像先前的,具有更强的州行动对,并具有更多的过渡数据。从数据集中估算过过渡矩阵时,跨州行动对的数据集估算了不均匀的数据集时,这会导致性能。在无模型的RL中,折扣正则化等同于计划使用加权平均贝尔曼更新,在该计划中,代理计划似乎所有州行动对的值都比数据所暗示的更接近。我们的等价定理促使简单的方法通过在本地设置个人状态行动对而不是全球的参数来概括常规ization。我们证明了折扣正则化的失败以及如何使用我们的州行动特定方法在经验示例中使用表格和连续状态空间进行纠正。
摘要。扩散模型已成为生成建模的强大框架。该方法的核心是分数匹配:在不同尺度上,数据分布的嘈杂版本的对数密度的学习梯度。当使用经验数据而不是人口损失评估评分匹配中采用的损失函数时,最小化器对应于时间依赖的高斯混合物的得分。但是,使用此分析可牵引的最小化器会导致数据记忆:在无条件和条件设置中,生成模型都返回训练样本。本文包含对记忆潜在的动力学机制的分析。分析强调了避免重现分析可牵引的最小化器的正规化的必要性;而且,这样做的基础是对如何正规化的原则理解。数值实验研究了:(i)Tikhonov正则化的特性; (ii)旨在促进渐近一致性的正则化; (iii)通过训练神经网络的神经网络的参数不足或提早停止引起的正常化。这些实验是在记忆的背景下评估的,并突出了未来正规化发展的方向。
这项工作调查了可符合性(3Þ1) - 二维nambu - Jona-Lasinio(NJL)模型的相结构,特别关注不均匀阶段(IPS),在该阶段(IPS)中,手掌凝结物在空间上是不均匀的,在空间上是不均匀的,密切相关的Moat Moat Companimes,在这里,在这里,有偏见的不合情对离的偏爱不合适的人类关系。我们使用平均场近似值,并考虑五个不同的正则化方案,包括三个晶格离散化。为了研究IP对正则化方案和调节剂价值的选择的依赖性,对不同正则化方案内的结果进行了系统的分析。IP对所选的正则化方案表现出极大的依赖性,该方案在该模型中对不均匀阶段的结果进行了任何物理解释。相比之下,我们发现护城河制度的一个温和的方案依赖性表明其存在是NJL模型及其对称性的作用的结果,因此它也可能存在于QCD中。
随机梯度下降(SGD)在实践中表现出强大的算法正则化效率,该算法在现代机器学习方法的概括中起着重要作用。在这项工作中,我们试图在线性回归的更简单设置(包括众多和参数化的政权)中理解这些问题,我们的目标是对(未注册)平均SGD与Ridge Regres-Sion的显式正规化提供(未注册的)平均SGD的隐性正规化比较。对于一系列最小二乘问题实例(在高维度中是自然的),我们显示:(1)对于每个问题实例和eviry Ridge参数((未进行定制)SGD),当在对数上提供的样品提供的样本比提供给山脊算法更糟糕的ridge songe(提供的常量)的样本(概括)不变的步骤(概括了SGD的常数)(概括) (2)相反,存在最佳调整的山脊回归需要的样本比SGD更多的样本以具有相同的概括性能。总的来说,我们的结果表明,到对数因素,SGD的概括性能总是不比Ridge回归的多种过度参数化的问题差,实际上,对于某些问题实例来说可能会更好。更普遍地,我们的结果表明,即使在更简单(过度参数化)凸设置中,算法正则化如何产生重要的后果。
现有的对象检测模型主要在大型标记的数据集上进行培训。但是,新型航空对象类的注释数据很昂贵,因为它耗时,可能需要专家知识。因此,希望研究航空效率上的标签有效对象检测方法。在这项工作中,我们提出了一种零拍方法,用于空中对象检测名为“视觉描述正则化”或“下降”。具体而言,我们确定了空中物体的弱语义 - 视觉相关性,并旨在通过先前描述其视觉外观来解决Challenge。否则将描述直接编码为具有差距概率的类嵌入空间,我们建议在描述中传达的先前的阶层间视觉模拟,以将描述传达到嵌入学习中。通过新签名的相似性感知的三重损失完成输注过程,该损失在表示空间上结合了结构的正则化。我们使用三个具有挑战性的空中对象进行数据集进行了广泛的实验,包括Dior,Xview和Dota。恢复表明,下降的表现明显优于具有复杂投影的最先进的ZSD方法,例如,discreg胜过discreg优于未看到类别的dior上的ZSD方法最佳报道的ZSD方法,而HM在HM中是8.1。我们通过将下降集成到生成ZSD方法以及改变检测体系结构中进一步显示了降落的概括性。代码将在https://github.com/zq-zang/descreg上进行重新租赁。
多视图无监督的特征选择(MUFS)最近引起了相当大的关注,可以从原始的多视图数据中选择紧凑的代表性特征子集。尽管有希望的初步性能,但大多数以前的MUFS方法都无法探讨多视图数据的歧视能力。此外,他们通常使用光谱分析来维持几何结构,这将不可避免地增加参数选择的难度。为了解决这些问题,我们提出了一种新颖的MUFS方法,称为基于结构正规化的歧视性多视图无监督特征选择(SDFS)。具体来说,我们从不同视图中计算样本空间的相似性矩阵,并自动加权每个视图特定图表以学习共识相似性图,其中这两种类型的图形可以相互促进。此外,我们将学习的潜在表示为群集指标,并在没有引入其他参数的情况下采用图形正则化来维护数据的几何结构。此外,开发了具有理论收敛属性的简单而有效的迭代更新算法。在几个基准数据集上进行的广泛实验验证了该设计的模型是否优于几种最新的MUFS模型。©2023 Elsevier B.V.保留所有权利。
我们提出了一个二维硬核环路模型,是一种在Berezinskii-kosterlitz-无用的过渡时期出现的渐近自由质量连续性量子场理论的一种方式。无需微调,我们的模型可以在接近相变时在大规模阶段重现经典晶格XY模型的通用级尺度函数。这是通过在热力学极限下降低回路配置空间中的fock-vacuum位点的散发性来实现的。与传统的XY模型相比,在Berezinskii-Kosterlitz上的某些通用量在我们的模型中显示出较小的有限尺寸效应。我们的模型是欧几里得时空中渐近自由质量量子场理论的Qubit正则化的一个典型例子,并有助于了解如何在不进行微调的情况下作为分离的固定点上的相关扰动而出现渐近自由。
摘要 - 在开发有希望的ULIS缩放技术的发展中,一个关键作用之一是由多孔介电特性扮演的,具有低介电常数,用于分离金属化系统中的互连。在此类膜的毛孔中的气态产物的凝结使得可以解决阻止这种膜整合的最重要的问题,以进行低破坏性的等离子体蚀刻。然而,研究孔隙率的方法也基于膜孔中凝结过程中的吸附等温线的研究。因此,毛孔吸附的研究是创建具有低介电常数的电介质的最重要的实际问题之一,并且研究了其结构化的低伤害方法。椭圆测量法的方法是一种易于实现和准确的方法,用于获得吸附等温线。但是,其对孔径分布的进一步分析和确定缩小为解决积分方程,这是一个错误的问题。在本文中,我们建议采用Tikhonov的统治方法来解决它。该方法在模型数据上进行了验证,并用于研究最初厚度为202 nm的低K介电样品,基于有机硅酸盐玻璃的介电常数为2.3。
抽象学习神经网络仅使用很少的可用信息是进口研究主题,具有巨大的应用潜力。在本文中,我们引入了一个强大的正规化程序,用于成像中反问题的变异建模。我们的常规器称为贴剂归一化流动器(PatchNR),涉及在很少的图像的小斑块上学习的归一化流。尤其是训练独立于考虑的逆问题,因此可以适用于在同一类图像上作用的不同远期操作员。通过研究斑块的分布与整个图像类别的分布,我们证明我们的模型确实是最大的后验方法。低剂量和限量角度计算机断层扫描(CT)以及材料图像的上溶质的数值示例表明,我们的方法提供了非常高质量的结果。该训练集仅包含六个用于CT的图像和一张用于超分辨率的图像。最后,我们将PatchNR与内部学习的想法结合在一起,直接从低分辨率观察中执行自然图像的超分辨率,而无需了解任何高分辨率图像。
在各种下游应用中,稀疏正则化的优化问题无处不在,例如深层神经网络(DNNS)的特征选择和压缩。尽管如此,当将这种正则化与随机损耗函数结合使用时,文献中现有的方法并不能很好地执行。,设计具有转换保证的计算有效算法并可以计算组较高的解决方案是一项挑战。最近,提出了一种半空间的预测梯度(HSPG)方法,部分解决了这些挑战。本文介绍了我们称之为ADAHSPG+的HSPG的大大增强版本,这取得了两个明显的进步。首先,与HSPG所要求的假设相比,ADAHSPG+在明显较宽的假设下具有更强的收敛结果。通过将差异技术与新的自适应策略整合在一起,以迭代预测解决方案的支持来实现这种改善。第二,与HSPG相比,ADAHSPG+的参数调整要少得多,从而使其更实用和用户友好。通过设计自动和自适应策略来选择每次迭代中采用的步骤类型并更新关键的HyperParam-eters来实现这一进步。我们提出的ADAHSPG+算法的数值有效性在凸面和非凸基准问题上都证明了。源代码可在https://github.com/tianyic/adahspg上找到。