摘要。社交触摸提供了人类和机器人之间丰富的非语言交流。先前的工作已经确定了一套用于人类互动的触摸手势,并用自然语言标签(例如,抚摸,拍拍)描述了它们。然而,尚无关于用户思想中的触摸手势之间的半智关系的数据。为了赋予机器人的触摸智能,我们调查了人们如何看待文献中的社会触摸标签的相似之处。在一项在线研究中,有45位参与者根据他们的相似之处对36个社交触摸标签进行了分组,并用描述性名称注释了他们的分组。我们从这些分组中得出了手势的定量相似性,并使用层次聚类分析了相似性。分析导致围绕手势的社会,情感和接触特征形成9个触摸手势。我们讨论了结果对设计和评估触摸感应和与社交机器人的互动的含义。
大脑中的肿瘤是由大脑内组织细胞不受管制的出现引起的。早期诊断并确定磁共振成像中肿瘤的精确位置(MRI)及其大小对于医生团队至关重要。图像分割通常被认为是医学图像分析中的初步步骤。k均值聚类已被广泛用于脑肿瘤检测。此技术的结果是群集图像的列表。这种方法的挑战是选择描绘肿瘤的适当簇部分的困难。在这项工作中,我们分析了不同图像簇的影响。然后将每个群集分为左右部分。之后,每个部分中都描绘了纹理特征。此外,还采用双边对称度量来估计包含肿瘤的簇。最后,采用连接的组件标记来确定用于脑肿瘤检测的靶标簇。已开发的技术应用于30个MRI图像。获得了87%的鼓励精度。
当通过某些宽度参数参数化时,可以在XP时间中解决大量NP -HARD图问题。因此,在解决特殊图类类别的问题时,知道所考虑的图形类是否有限制宽度是有帮助的。在本文中,我们考虑MIM Width,这是一个特别通用的宽度参数,每当分解为“快速计算”的图形类别时,它具有许多算法应用程序。我们首先扩展了用于证明图形类MIM宽度的工具包。通过将我们的新技术与已知技术相结合,然后从遗传图类别的角度开始进行系统研究,以对MIM宽度进行边界,并与Clique宽度进行比较,这是一个经过深入研究的更严格的宽度参数。我们证明,对于给定的图H,当h-free graph的类别在且仅当它具有限制的clique-width时具有界限。我们表明(h 1,h 2)无图形是不正确的。我们确定了(h 1,h 2)的几个通用类别的无界图形宽度但有界的含量宽度的无限制图,这说明了中间宽度的力量。此外,我们表明,对于这些类别,可以在多项式时间内找到恒定模拟宽度的分支分解。因此,如前所述,这些结果具有算法的含义:当输入仅限于这样一类(H 1,H 2)无图形时,许多问题变成了多项式的可溶可求解,包括经典问题,包括k-着色和独立设置,统治性问题,已知的LC-VSVP问题,以及LC-lc-lc-lc-lc-vsvp的距离vsvp vesvp的距离很少。我们还证明了许多新的结果,表明在某些H 1和H 2中,(H 1,H 2)的类别的类别无绑定的MIM宽度。集团宽度的界限意味着MIM宽度的界限。通过将我们的结果结合起来,这给出了新的有界和无界的MIM宽度案例,并与已知的有界案例进行了集体宽度的情况,我们介绍了当前最新情况的摘要定理(H 1,H 2) - 免费图形。特别是,我们将所有对(H 1,H 2)的MIM宽度分类为所有对(H 1,H 2)的无图形图(H 1,H 2) V(H 1)| + | v(h 2)| ≤8。当h 1和h 2是连接的图时,我们将所有对(H 1,H 2)分类,除了剩余的有限族和一些孤立的病例。
基于锚点的大规模多视图聚类因其在处理海量数据集方面的有效性而引起了广泛关注。然而,当前的方法主要通过探索锚点图或投影矩阵之间的全局相关性来寻找用于聚类的共识嵌入特征。在本文中,我们提出了一种简单而有效的可扩展多视图张量聚类(S 2 MVTC)方法,我们的重点是学习视图内和跨视图的嵌入特征的相关性。具体而言,我们首先通过将不同视图的嵌入特征堆叠到张量中并旋转它来构造嵌入特征张量。此外,我们构建了一种新颖的张量低频近似(TLFA)算子,它将图相似性结合到嵌入特征学习中,有效地实现不同视图内嵌入特征的平滑表示。此外,对嵌入特征应用共识约束以确保视图间语义一致性。在六个大规模多视图数据集上的实验结果表明,S 2 MVTC 在聚类性能和 CPU 执行时间方面明显优于最先进的算法,尤其是在处理海量数据时。S 2 MVTC 的代码已公开发布在 https://github.com/longzhen520/S2MVTC。
近年来,基于锚点的方法在多视图聚类中取得了可喜的进展。这些方法的性能受到锚点质量的显著影响。然而,以前的研究生成的锚点仅仅依赖于单视图信息,忽略了不同视图之间的相关性。特别地,我们观察到相似的模式更有可能存在于相似的视图之间,因此可以利用这种相关性信息来提高锚点的质量,而这同样被忽略了。为此,我们提出了一种新颖的即插即用的通过视图相关性进行多视图聚类的锚点增强策略。具体而言,我们基于对齐的初始锚点图构建视图图来探索视图间相关性。通过从视图相关性中学习,我们使用相邻视图上锚点和样本之间的关系来增强当前视图的锚点,从而缩小相似视图上锚点的空间分布。在七个数据集上的实验结果证明了我们的方法优于其他现有方法。此外,大量的对比实验验证了所提出的锚增强模块应用于各种基于锚的方法时的有效性。
对抗训练(AT)是提高深度神经网络鲁棒性的最常用机制。最近,一种针对中间层的新型对抗攻击利用了对抗训练网络的额外脆弱性,输出错误的预测。这一结果说明对抗训练中对抗扰动的搜索空间不足。为了阐明中间层攻击有效的原因,我们将前向传播解释为聚类效应,表征神经网络对于与训练集具有相同标签的样本的中间层表示相似,并通过相应的信息瓶颈理论从理论上证明了聚类效应的存在。随后我们观察到中间层攻击违反了 AT 训练模型的聚类效应。受这些重要观察的启发,我们提出了一种正则化方法来扩展训练过程中的扰动搜索空间,称为充分对抗训练(SAT)。我们通过严格的数学证明给出了经过验证的神经网络鲁棒性界限。实验评估表明,SAT 在防御针对输出层和中间层的对抗性攻击方面优于其他最先进的 AT 机制。我们的代码和附录可以在 https://github.com/clustering-effect/SAT 找到。
聚类在多种生物信息学应用中起重要作用,包括蛋白质功能预测,种群遗传学和基因表达分析。大多数聚类算法的结果对输入数据的变化,聚类算法及其参数和各个数据集敏感。共识聚类(CC)是聚类算法的扩展,旨在从上述变化来源下不变的那些群集特征构建强大的结果。作为CC的一部分,稳定性得分可以提供所得聚类的可靠性程度的概念。本综述将CC在文献中介绍为三种主要类型,介绍并说明了稳定分数的概念,并说明了在应用中使用CC来模拟和现实的基因表达数据集。Open-source R implementations for each of these CC algorithms are available in the GitHub repository: https://github.com/behnam-yousefi/ConsensusClustering Keywords: Consensus clustering, Ensemble clustering, Robustness, Generation mechanism, Stability score
基于聚类的置换检验广泛用于神经科学研究中,用于分析高维脑电图 (EEG) 和事件相关电位 (ERP) 数据,因为它可以解决多重比较问题而不会降低统计功效。然而,经典的基于聚类的置换分析依赖于参数 t 检验,如果数据分布不正态,则可能无法验证其假设,因此可能需要考虑其他选择。为了克服这一限制,我们在此介绍了一种基于非参数 Wilcoxon-Mann-Whitney 检验的 EEG 序列聚类置换分析新软件。我们在两个独立的 ERP 和 EEG 频谱数据集中测试了 t 检验和非参数 Wilcoxon 实现:虽然基于 t 检验和基于非参数 Wilcoxon 的聚类分析在 ERP 数据的情况下显示出相似的结果,但 t 检验实现无法在频谱数据的情况下发现聚类效应。我们鼓励使用非参数统计数据对 EEG 数据进行聚类置换分析,并且我们为此计算提供了一个公开可用的软件。© 2022 作者。由 Elsevier BV 出版这是一篇根据 CC BY-NC-ND 许可开放获取的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。
摘要K -Means聚类算法是数据挖掘和未加剧的学习的主要内容,之所以受欢迎,是因为它易于实现,快速,易于并行化并提供直观的结果。劳埃德的算法是标准批量的爬山方法,用于最大程度地减少K-均值优化标准。它花费了大部分时间计算k群集中心和n个数据点之间的距离。事实证明,这项工作的大部分是不必要的,因为在第一次迭代之后,点通常会留在同一集群中。在过去的十年中,研究人员开发了许多优化,以加快劳埃德(Lloyd)的算法的低维数据和高维数据。在本章中,我们调查了其中一些优化,并提出了新的优化。特别是我们专注于避免通过三角形不等式计算距离的那些。通过缓存已知距离并用三角形不等式更新它们,这些算法可以避免许多不必要的距离计算。所检查的所有优化产生的结果与劳埃德的算法相同,给定的输入和初始化,因此适用于倒入替换。这些新算法的运行速度比标准未取代的实现更快,并且计算距离要少得多。在我们的实验中,与劳埃德算法相比,通常会看到超过30-50倍的加速度。我们研究了使用这些方法的示例n,dimensions d,簇K和数据结构的权衡。