对抗训练(AT)是提高深度神经网络鲁棒性的最常用机制。最近,一种针对中间层的新型对抗攻击利用了对抗训练网络的额外脆弱性,输出错误的预测。这一结果说明对抗训练中对抗扰动的搜索空间不足。为了阐明中间层攻击有效的原因,我们将前向传播解释为聚类效应,表征神经网络对于与训练集具有相同标签的样本的中间层表示相似,并通过相应的信息瓶颈理论从理论上证明了聚类效应的存在。随后我们观察到中间层攻击违反了 AT 训练模型的聚类效应。受这些重要观察的启发,我们提出了一种正则化方法来扩展训练过程中的扰动搜索空间,称为充分对抗训练(SAT)。我们通过严格的数学证明给出了经过验证的神经网络鲁棒性界限。实验评估表明,SAT 在防御针对输出层和中间层的对抗性攻击方面优于其他最先进的 AT 机制。我们的代码和附录可以在 https://github.com/clustering-effect/SAT 找到。
基于锚点的大规模多视图聚类因其在处理海量数据集方面的有效性而引起了广泛关注。然而,当前的方法主要通过探索锚点图或投影矩阵之间的全局相关性来寻找用于聚类的共识嵌入特征。在本文中,我们提出了一种简单而有效的可扩展多视图张量聚类(S 2 MVTC)方法,我们的重点是学习视图内和跨视图的嵌入特征的相关性。具体而言,我们首先通过将不同视图的嵌入特征堆叠到张量中并旋转它来构造嵌入特征张量。此外,我们构建了一种新颖的张量低频近似(TLFA)算子,它将图相似性结合到嵌入特征学习中,有效地实现不同视图内嵌入特征的平滑表示。此外,对嵌入特征应用共识约束以确保视图间语义一致性。在六个大规模多视图数据集上的实验结果表明,S 2 MVTC 在聚类性能和 CPU 执行时间方面明显优于最先进的算法,尤其是在处理海量数据时。S 2 MVTC 的代码已公开发布在 https://github.com/longzhen520/S2MVTC。
摘要 — 本文提出了一种基于电网内现行功率流条件的节点聚类新方法。为此,首先,将网络的有功功率流状态建模为有向无环图。该有向图明确表示功率流向何处,这有助于监控和分析系统漏洞。有向无环图表示还可以轻松识别仅提供或吸收有功功率的总线:这些总线分别是纯源节点和纯汇节点。对系统中的每个节点应用迭代路径查找程序,以枚举供电的源节点和其将功率转发到的下游汇节点。然后应用新颖的聚类算法将共享同一组可达源节点和汇节点的节点分组在一起。首先提出这种新颖的聚类方法作为一种工具,通过更好地总结大型电网中的总功率流配置来提高控制室操作员的态势感知能力。所提出的方法应用于两个样本电网,并阐述了与河流系统的类比,将支流、分流和中央主流等概念应用于电网。
1。一种自我监督的模型登录方法,仅取决于正面匹配对以改善面部嵌入。2。面部聚类的基于深度学习的相似性度量,该指标会自动适应给定模型的学习嵌入空间。3。不需要任何用户输入参数的全自动视频面聚类算法。4。发布电影脸聚类基准数据集,称为MoviefaceCluster,该数据集提供了电影域中存在的极端挑战的面部聚类场景。
近年来,基于锚点的方法在多视图聚类中取得了可喜的进展。这些方法的性能受到锚点质量的显著影响。然而,以前的研究生成的锚点仅仅依赖于单视图信息,忽略了不同视图之间的相关性。特别地,我们观察到相似的模式更有可能存在于相似的视图之间,因此可以利用这种相关性信息来提高锚点的质量,而这同样被忽略了。为此,我们提出了一种新颖的即插即用的通过视图相关性进行多视图聚类的锚点增强策略。具体而言,我们基于对齐的初始锚点图构建视图图来探索视图间相关性。通过从视图相关性中学习,我们使用相邻视图上锚点和样本之间的关系来增强当前视图的锚点,从而缩小相似视图上锚点的空间分布。在七个数据集上的实验结果证明了我们的方法优于其他现有方法。此外,大量的对比实验验证了所提出的锚增强模块应用于各种基于锚的方法时的有效性。
聚类是算法中的一个重要主题,在机器学习、计算机视觉、统计学和其他几个研究学科中有着广泛的应用。图聚类的传统目标是找到具有低电导性的聚类。这些目标不仅适用于无向图,而且无法考虑聚类之间的关系,而这对于许多应用来说可能是至关重要的。为了克服这些缺点,我们研究了有向图(有向图),其聚类彼此之间展示了更多的“结构”信息。基于有向图的 Hermitian 矩阵表示,我们提出了一种近线性时间的有向图聚类算法,并进一步表明我们提出的算法可以在合理的假设下以亚线性时间实现。我们的理论工作的意义通过对联合国商品贸易统计数据集的大量实验结果得到证明:我们算法的输出聚类不仅展示了聚类(国家集合)在进出口记录方面如何相互关联,还展示了这些聚类如何随着时间的推移而演变,这与已知的国际贸易事实一致。
摘要 研究:AI 社会认知评估与建模。评估 LLM 中的心智理论及其在心理学中的应用 NLP:LLM IFT、表征学习(对比和三重态损失)、语义聚类、总结 DL:Transformers、MoE、EncDec、RNNs、DPO、LoRA 工具:Python、Pytorch、Deepspeed、AWS Sagemaker、hydra、SQL 管理:建立 ML 团队、职能、策略和 OKR、招聘和指导科学家和实习生以及建立数据和注释合作伙伴关系。
气候变化对全球农业生产力和粮食安全构成了重大威胁。气候变化对农作物产量的影响变得越来越明显,尤其是在严重依赖农业生存的发展和低收入国家。这些地区通常缺乏有效适应所需的基础设施,使其特别容易受到与气候相关的破坏的影响。本研究研究了气候变化与农业之间的复杂关系,突出了温度变化,降水模式的变化。这项研究主要侧重于通过应用聚类技术来检查气候变化对农业的影响。具体来说,它旨在探索各种气候和农业因素之间的关系,例如作物产量,经济影响和适应策略。使用无监督的机器学习方法,该研究分析了一个数据集,其中包含温度,降水,二氧化碳排放,灌溉通道,土壤健康指数和适应策略等特征。聚类算法(包括K-均值,DBSCAN和聚集聚类)被采用,将数据分组为不同的集群,从而揭示了不同地区和农业实践如何受到气候变化影响的模式。此外,该研究强调了较高的作物产量与增加的经济利益之间的联系。使用轮廓分数评估每个模型的聚类性能,以测量簇的质量。
心脏转录组轮廓的聚类揭示了独特的:扩张的心肌病患者的亚组。verdonschot,J.A.J。;王,ping; Derks,K.W.J。; Adriaens,M.E。; Stroeks,S.L.V.M.;亨肯斯(M.T.H.M.); RAAFS,A.G。;锡金Koning,B。de; Wijngaard,A。VanDen; Krapels,I.P.C。;纳本(M。) Brunner,H.G。; Heymans,S.R.B。2023,给编辑的文章 /信(JACC-BASIC to Translatitation Science,8,4,(2023),pp。< / div>406-418)
CMS电磁热量表(ECAL)是由约75000铅钨(PBWO 4)晶体制成的同型热量表。它位于跟踪器和辐射热量计之间,分为两个主要部分:枪管(crystal size:2。2 x 2。2 x 23厘米),覆盖伪to | η| <1。479和端盖(晶体大小:2。9 x 2。9 x 23厘米),覆盖假性1。479 <| η| <3。0。ECAL对于重建光子和电子是必需的,以及喷气机能量和缺失横向动量的测量[1]。当电子或光子横穿ECAL时,它将能量沉积在多个晶体中(“充值”)。簇是通过收集最大能量的能量沉积物来建造的。每个群集归因于一个粒子或几个隔板颗粒。但是,电子和光子可以与ECAL前面的材料相互作用。在这种情况下,电子发射Bremsstrahung光子和光子转换为电子对,在ECAL中产生附近的多个簇。这些簇必须合并以重建初始粒子的能量。此组合称为超级收集器[2]。当前,几何方法用于重建供应商。首先,找到具有在给定阈值较高的(种子)上方的能量的簇[2]。然后,在种子周围打开一个窗口,其形状类似于(η,ϕ)平面中的胡须。之所以选择这种形状,是因为簇沿横向ϕ轴而不是由于CMS磁场引起的纵向η轴(3.8 t)。窗口的大小在种子的η位和cluster的能量上。最后,所有落入定义窗口中的群集被认为是超集群的一部分。由于几何窗口的形状,所述算法称为“胡须”。