在这项工作中,我们考虑了发布驻留在黎曼流形上的差分隐私统计摘要的问题。我们提出了拉普拉斯或 K 范数机制的扩展,该机制利用了流形上的固有距离和体积。我们还详细考虑了摘要是驻留在流形上的数据的 Fréchet 平均值的特定情况。我们证明了我们的机制是速率最优的,并且仅取决于流形的维度,而不取决于任何环境空间的维度,同时还展示了忽略流形结构如何降低净化摘要的效用。我们用两个在统计学中特别有趣的例子来说明我们的框架:对称正定矩阵的空间,用于协方差矩阵,以及球面,可用作离散分布建模的空间。
神经科学中的一个常见问题是阐明行为上重要的变量(例如头部方向、空间位置、即将发生的动作或心理空间变换)的集体神经表征。通常,这些潜在变量是实验者无法直接访问的内部构造。在这里,我们提出了一种新的概率潜在变量模型,以无监督的方式同时识别潜在状态和每个神经元对其表征的贡献方式。与以前假设欧几里得潜在空间的模型相比,我们接受这样一个事实,即潜在状态通常属于对称流形,例如球面、环面或各种维度的旋转群。因此,我们提出了流形高斯过程潜在变量模型 (mGPLVM),其中神经响应来自 (i) 存在于特定流形上的共享潜在变量,以及 (ii) 一组非参数调整曲线,确定每个神经元如何对表征做出贡献。可以使用具有不同拓扑结构的模型的交叉验证比较来区分候选流形,而变分推理可以量化不确定性。我们在几个合成数据集以及果蝇椭圆体的钙记录和小鼠前背丘脑核的细胞外记录上证明了该方法的有效性。众所周知,这些电路都编码头部方向,而 mGPLVM 正确地恢复了代表单个角度变量的神经群体所期望的环形拓扑。
[2]`A. Haro等。不变流形的参数化方法:从严格的结果到e显计算。卷。195。应用数学科学。Springer International Publishing,2016年。ISBN:9783319296623。
为了识别癫痫患者的异常脑电图 (EEG) 信号,在本研究中,我们提出了一种基于联合分布自适应和流形正则化的在线选择性转移 TSK 模糊分类器。与大多数现有的转移分类器相比,我们的分类器有自己的特点:(1)来自源域的标记 EEG 时期不能准确表示目标域中的原始 EEG 时期。我们的分类器可以利用目标域中很少的校准数据来诱导目标预测函数。(2)联合分布自适应用于最小化源域和目标域之间的边缘分布距离和条件分布距离。(3)使用聚类技术选择源域,从而降低分类器的计算复杂度。我们根据波恩大学提供的原始 EEG 信号构建了六种传输场景来验证我们分类器的性能,并引入四个基线和一个传输支持向量机 (SVM) 进行基准研究。实验结果表明,我们的分类器获得了最佳性能并且对其参数不太敏感。
神经活动通常是低维的,并且仅由少数几个突出的神经共变模式主导。有人假设这些共变模式可以形成用于快速灵活运动控制的基石。支持这一想法的是,最近的实验表明,猴子可以在几分钟内学会调整其运动皮层中的神经活动,前提是变化位于原始低维子空间(也称为神经流形)内。然而,这种流形内适应背后的神经机制仍然未知。在这里,我们在计算模型中表明,由学习到的反馈信号驱动的循环权重修改可以解释在流形内和流形外学习之间观察到的行为差异。我们的研究结果提供了一个新的视角,表明循环权重变化不一定会导致神经流形发生变化。相反,成功的学习自然会限制在一个共同的子空间中。
数据敏感度量自然出现在机器学习中,并且在一些著名方法中起着核心作用,例如 k-NN 图方法、流形学习、水平集方法、单链接聚类和基于欧氏 MST 的聚类(详情见第 5 节和附录 A)。构建合适的数据敏感度量是一个活跃的研究领域。我们考虑一个简单的数据敏感度量,它有一个底层流形结构,称为最近邻度量。该度量最早在 [CFM + 15] 中引入。它及其近似变体在过去已被多位研究人员研究过 [HDHI16、CFM + 15、SO05、BRS11、VB03]。在本文中,我们展示了如何精确计算任意维度的最近邻度量,这解决了任何基于流形的度量最重要和最具挑战性的问题之一。
