摘要 - 近年来,关于聚类算法的许多研究主要集中在提高其准确性和效率上,通常以牺牲可解释性为代价。但是,由于这些方法越来越多地应用于医疗保健,金融和自主系统等高风险领域,因此对透明和可解释的聚类结果的需求已成为一个关键问题。这不仅需要获得用户信任,而且还需要满足这些领域不断增长的道德和监管要求。确保可以清楚地理解和合理的聚类算法的决策是基本要求。为了满足这一需求,本文对可解释的聚类算法的当前状态进行了全面且结构化的综述,并确定了关键标准以区分各种方法。这些见解可以有效地帮助研究人员对特定应用程序环境的最合适的可解释聚类方法做出明智的决策,同时还促进了既高效又透明的聚类算法的开发和采用。
摘要。社交触摸提供了人类和机器人之间丰富的非语言交流。先前的工作已经确定了一套用于人类互动的触摸手势,并用自然语言标签(例如,抚摸,拍拍)描述了它们。然而,尚无关于用户思想中的触摸手势之间的半智关系的数据。为了赋予机器人的触摸智能,我们调查了人们如何看待文献中的社会触摸标签的相似之处。在一项在线研究中,有45位参与者根据他们的相似之处对36个社交触摸标签进行了分组,并用描述性名称注释了他们的分组。我们从这些分组中得出了手势的定量相似性,并使用层次聚类分析了相似性。分析导致围绕手势的社会,情感和接触特征形成9个触摸手势。我们讨论了结果对设计和评估触摸感应和与社交机器人的互动的含义。
摘要 - 随着机器学习的更广泛采用以及对数据隐私的越来越关注,联邦学习(FL)受到了极大的关注。FL计划通常使一组参与者(即数据所有者)使用其本地数据单独训练机器学习模型,然后将其通过中央服务器的协调来汇总以构建全局FL模型。对标准FL的改进包括(i)通过利用梯度稀疏和(ii)通过采用隐私性汇总(PPAGG)协议来增强聚合的安全性,从而减少梯度传输的通信开销。但是,由于用户稀疏梯度向量的异质性,最新的PPAGG协议并不能轻易与梯度稀疏相互互操作。为了解决此问题,我们提出了一种动态用户聚类(DUC)方法,并采用一组支持协议,根据PPAGG协议和梯度稀疏技术的性质将用户分配到集群中,提供安全性的质量和通信效率。实验结果表明,与基准相比,DUC-FL显着降低了通信开销,并实现了相似的模型精度。所提出的协议的简单性使其对实施和进一步的改进都具有吸引力。
摘要:在不同投影场景下,气候模拟的时空分辨率的复杂性产生了多种气候模式。本文通过一种无监督的深度学习技术提出了一种新的数据驱动的气候分类工作,该技术可以在尺寸上降低大量时空数值气候投影数据中的大量紧凑表示。我们旨在确定捕获多个气候变量的不同区域以及在不同气候变化方案下的未来变化。我们的方法利用卷积自动编码器与K-均值聚类(标准自动编码器)和在线聚类相结合,基于sindhorn - Knopp算法(群集自动编码器),整个Conterminous美国(CONUS)(CONUS)(CONUS)捕获来自数据驱动的气候型号的独特气候式的goldement offeration Androm intery Demplyicals todlement todlement todlemant througation dynerical offer -Gromys toym intery dynerical demancortial dynerical ofderational dynerical officolt offer。 (GFDL-ESM2G)。开发的方法在多个变暖方案下以0.125 8的0.125 8将70年的GFDL-ESM2G仿真压缩为较低维空间的空间分辨率为660000倍,然后在150年的GFDL-ESM2G仿真数据中测试了150年。结果表明,五个气候群体捕获了与人类专家定义的已知气候类别相匹配的物理合理和空间稳定的气候效果。结果还表明,与使用标准自动编码器相比,使用群集自动编码器可以将聚类的计算时间限制为9.2倍。我们五个独特的气候模式是由深度学习引起的 - 基于较低维空间的聚类,从而使我们能够在整个综合美国立即提供有关水力气学及其空间异质性的见解,而无需下载大量的大气候数据集。
本文介绍了一种基于闵可夫斯基数学相似性的新型聚类方法,以改进用于分类的EEG特征选择,并在机器学习的背景下实现高效的粒子群优化(PSO)。鉴于高维医学数据集的复杂性,特征选择在预防疾病和促进公共健康方面起着至关重要的作用。通过采用闵可夫斯基聚类,目标是将数据集记录分组为两个具有高特征一致性的聚类,从而通过应用 PSO 等优化技术来选择最优特征,从而提高准确性。此外,所提出的模型可以扩展到智能数据集,包括EEG和其他数据集。由于精确分类所需的特征较少,因此智能特征选择是机器学习的一个高级步骤。本文研究了影响波恩大学EEG数据集中特征选择的关键因素。将所提出的系统与各种优化和特征选择方法进行了比较,结果表明,在基于准确度测量分析和分类EEG信号方面具有卓越的性能。实验结果证实了所提出的模型作为脑电图数据分类的有用工具的有效性,准确率高达 100%。这项研究的成果有可能通过简化识别和诊断脑部疾病的过程,使相关专业的医学专家受益。从技术上讲,机器学习算法 RF、KNN、SVM、NB 和 DT 用于对选定的特征进行分类。
磁共振成像(MRI)等神经成像技术的快速发展促进了我们获取大脑结构和功能特征。脑网络分析是从 MRI 探索大脑机制的重要工具之一,它为大脑组织提供有价值的见解,并促进对大脑认知和神经退行性疾病病理的理解。图神经网络(GNN)通常用于脑网络分析,但它们受到医疗数据稀缺的限制。虽然已经开发了图对比学习方法来解决这个问题,但它们通常涉及扭曲大脑解剖结构的图增强。为了应对这些挑战,本文提出了一种无增强的对比学习方法,即基于自促进聚类的对比学习(SPCCL)。具体而言,通过引入基于聚类的对比学习损失和自促进对比对创建方案,所提出的 SPCCL 可以从比疾病患者数据相对容易获取的其他健康受试者数据中进行预训练。所提出的 SPCCL 利用这些额外的数据来保持原始大脑结构的完整性,使其成为一种有效的大脑网络分析的有前途的方法。在开放获取的精神分裂症数据集上进行了全面的实验,证明了所提出方法的有效性。
抽象背景我们旨在研究固定剂量组合疗法(Polypill)在典型的农村环境中对主要心血管疾病的一级和次要预防的有效性。方法息肉研究是一项嵌套在PARS队列研究中的两臂务实的簇伴形的试验,其中包括所有在伊朗南部整个地区的50岁以上的居民。91个村庄将随机分配分为两个臂:控制臂,包括45个集群,接受了非药物干预(健康生活方式的教育培训),而由46个群集组成的干预组与曾经每天的POLYPILL TABLET相结合。该片剂包括两种抗高血压剂,一个汀类药物和阿司匹林。主要结果是首次发生重大心血管事件,该事件定义为急性冠状动脉综合征(非致命性心肌梗塞和不稳定的心绞痛),致命的心肌梗塞,非致命性和致命性和致命性和致命的中风,突然的死亡和心力衰竭。具有共同脆弱的Cox回归模型用于解释聚类效应。2015年12月至2016年12月12日,招募了4415名50-75岁的参与者(2200名干预部门参与者,2215名参与者参加了控制部门)。随访持续时间的总体中位数为4。6年(四分位间隔4.4-4.9)。在干预组中达到的粘附率为86%。两组之间没有观察到严重不良事件的差异。在对照组中,2215名参与者中有176名(8.0%)出现了主要结果,而Polypill组的2200名参与者中有88名(4.0%)。我们发现,相对和绝对尺度的主要结果风险大大降低(HR 0.50,95%CI 0.38至0.65;绝对风险降低4.0%,95%CI 2.5%至5.3%)。结论固定剂量联合疗法使用polypill可以安全地将主要心血管疾病的风险减半。试用注册号NCT03459560。
在本文中,我们介绍了一种新颖的多尺度和自动调整的半监督深度子空间聚类(MAS-DSC)算法,旨在解决高维现实世界数据(特别是在医学成像领域)中深度子空间聚类的挑战。传统的深度子空间聚类算法大多是无监督的,其有效利用医学图像中固有的先验知识的能力有限。我们的 MAS-DSC 算法结合了半监督学习框架,使用少量标记数据来指导聚类过程,从而增强了特征表示的判别能力。此外,多尺度特征提取机制旨在适应医学成像数据的复杂性,从而实现更准确的聚类性能。为了解决深度子空间聚类中超参数选择的困难,本文采用贝叶斯优化算法来自适应调整与子空间聚类、先验知识约束和模型损失权重相关的超参数。在ORL、Coil20、Coil100等标准聚类数据集上进行的大量实验验证了MAS-DSC算法的有效性。结果表明,通过多尺度网络结构和贝叶斯超参数优化,MAS-DSC在这些数据集上取得了优异的聚类结果。此外,在脑肿瘤数据集上的测试证明了该算法的鲁棒性,以及其在半监督学习框架下利用先验知识进行高效特征提取和增强聚类性能的能力。
可用的基于本地调查的估计值涵盖了各种年龄段和人群,几乎已经二十年了。对1994年中部省份975名中年男性(35-59岁)的研究发现,使用Rose Angina问卷(RAQ),有5.4%的参与者满足了心绞痛的标准或可能的心肌梗塞,另外3.2%的人满足了IHD的ECG标准[7]。在2005年在斯里兰卡的9个省中有4,484人的研究中,根据RAQ,ECG标准和IHD治疗,斯里兰卡的估计年龄性别标准化IHD患病率为9.3%[8]。女性(11.3%)的患病率高于男性(7.2%)。2003年在斯里兰卡四个省的30-65岁儿童的另一项研究发现,使用RAQ的女性中有4.9%和4.5%的男性患有心绞痛[9,10]。
摘要我们通过将近地表的近表面空气温度与行星边界层高度进行聚类,从而引入了新的方法论进步,以表征分析的城市内群集。为了说明这种方法,我们分析了三个热浪(HWS):2019年在巴黎,2018年的HW,蒙特利尔的2018 HW和Zurich的2017 HW。我们在热波事件发生之前,期间和之后评估基于群集的特征。,尽管该聚类通过中等分辨率成像光谱仪(MODIS)土地覆盖数据获得的建筑区域确定的城市群集与内置区域保持一致,但也可以识别出跨越几公里的其他当地热点,并扩展到建筑区域之外。使用客观的滞后模型,我们进一步确定了地面存储通量和全波向下辐射通量之间的磁滞循环的总体强度系数,在热浪期间,农村簇的城市群集的范围从0.414到0.457,从0.126到0.126到0.157。在所有城市中,随着热浪的进展,我们观察到累积的地面热通量中的加油率模式。这种提出的两组分聚类方法的未来发展,并将更具影响力的物理学和空间和时间分辨率的进步整合在一起,将为城市气候分析的城市提供更全面的特征。
