气候模型旨在尽可能紧密地表示气候组件的统计特性,包括极端的事件,这些事件可能较少可用。这是由于人为强迫而导致的动态变化的基本要求。为了评估模型如何匹配观测值,我们需要能够选择,处理和评估气候组件的相关动力学特征的算法。必须对大型数据集有效地重申这一点,例如耦合模型对比项目6(CMIP6)发行的数据集。在这项工作中,我们使用潜在的Dirichlet分配(LDA),这是一种最初设计用于自然语言处理的统计软聚类方法,从海平面压力数据中提取天气模式,并评估CMIP6气候模型的动力学与ERA的动力学的近距离,无论是在总体情况下以及在极端温度事件的情况下,均与ERA 5 rean分析。
如果γ= 0,则表达式tr(h b -λ)0-更为常用于“计数函数”,并用n(h b,λ)表示。众所周知,特征值{λn(,b)}n∈Na sa作为b∈R上的函数,可以通过实用分析的特征值分支来识别零件。这是分析扰动理论的经典结果,例如参见Kato [1,第VII章第3和§4]。在此框架中,操作员{h b}形成一种类型(b)自我偶像霍尔态家族。代表家族{H B}光谱的特征值分支通常不维护特定顺序,因为不同的分支可以相交。我们对h b的频谱的行为感兴趣,因为实力b变得很大。我们的第一个结果(定理2.1)处理磁盘的特殊情况。在这里,{h b}b∈R的光谱的所有真理特征值分支都按照融合的超测量功能的根来给出。我们计算所有分析特征值分支的两个学期渐近学。此结果通过Helffer和Persson Sundqvist [2]概括了定理。在本文的第二部分中,我们关注分类特征值λN(,b)的光谱界限以及riesz表示TR(H B -λ)γ-。要在现有文献中找到我们的作品,让我们布里特(Brie brie)总结了重要的相关结果。
离散扩散或流模型可以比自回归模型更快,更可控制的序列生成。我们表明,单纯形上的线性流量匹配不足以实现此目标,因为它遭受了训练目标中的不连续性和进一步的病理。为了克服这一点,我们基于Dirichlet分布作为概率路径的混合物在单纯形上开发了Dirichlet流量匹配。在此框架中,我们得出了混合物的分数与流量向量字段之间的连接,从而允许分类器和无分类器的GUID-ANCE。此外,我们提供了蒸馏的Dirichlet流量匹配,从而使一步序列发电具有最小的性能命中,从而与自回旋的模型相比,导致O(L)加速。在复杂的DNA序列生成任务上,我们证明了与分布指标的所有基准相比,在实现生成序列的所需设计目标方面相比。最后,我们表明我们的分类器免费指导方法改善了无条件的生成,并且有效地生成满足设计目标的DNA。代码可在https://github.com/hannesstark/ dirichlet-flow-matching上找到。
神经序列检测在神经科学研究中起着至关重要的作用。最近令人印象深刻的作品利用卷积非负矩阵分解和 Neyman-Scott 过程来解决这个问题。然而,它们仍然面临两个限制。首先,它们将整个数据集容纳到内存中并执行多次迭代更新,当数据集很大或频繁增长时,这可能效率低下。其次,它们依赖于序列类型数量的先验知识,当未来情况未知时,这对于数据来说可能不切实际。为了解决这些限制,我们提出了一个分层狄利克雷点过程模型来有效地进行神经序列检测。我们的模型不需要计算整个数据,而是可以使用粒子过滤器以在线无监督的方式顺序检测序列。此外,狄利克雷先验使我们的模型能够根据需要自动动态引入新的序列类型,从而避免提前指定类型的数量。我们在来自鸣禽高级发声中心和啮齿动物海马的合成数据和神经记录上体现了这些优势。