谱聚类是聚类无向图的一种常用方法,但将其扩展到有向图(有向图)则更具挑战性。一种典型的解决方法是简单地对称化有向图的邻接矩阵,但这可能会导致丢弃边方向性所携带的有价值信息。在本文中,我们提出了一个广义的谱聚类框架,可以处理有向图和无向图。我们的方法基于一个新泛函的谱松弛,我们将其引入为图函数的广义狄利克雷能量,关于图边上的任意正则化测度。我们还提出了一种由图上自然随机游走的迭代幂构建的正则化测度的实用参数化。我们提出了理论论据来解释我们的框架在非平衡类别的挑战性设置中的效率。使用从真实数据集构建的有向 K-NN 图进行的实验表明,我们的图分区方法在所有情况下均表现良好,并且在大多数情况下优于现有方法。
白质病变 (WML) 是多种脑部疾病的根源,而自动 WML 分割对于评估自然病程和临床干预措施(包括药物研发)的有效性至关重要。尽管最近的研究在 WML 分割方面取得了巨大进展,但准确检测疾病早期出现的细微 WML 仍然特别具有挑战性。在这里,我们提出了一种使用强度标准化技术、灰度共生矩阵 (GLCM) 嵌入聚类技术和随机森林 (RF) 分类器自动分割轻度 WML 负荷的方法,以提取纹理特征并识别特定于真正 WML 的形态。我们通过局部离群值因子 (LOF) 算法精确定义它们的边界,该算法通过相对于其邻居的局部密度偏差来识别边缘像素。该自动化方法已在 32 名人类受试者身上进行了验证,结果显示,通过类内相关性 (ICC = 0.881,95% CI 0.769, 0.941) 和皮尔逊相关性 (r = 0.895,p 值 < 0.001),与神经放射科医生的手动描绘具有很强的一致性和相关性(排除一个异常值),并且在 MICCAI 大挑战赛中定义的六个既定关键指标中的五个方面优于三种领先算法(修剪均值异常值检测、病变预测算法和 SALEM-LS)。通过促进对细微 WML 的更精确分割,该方法可以实现更早的诊断和干预。
聚类分析起源于分类学,是人类掌握的一门古老技能。过去,人们依据经验和专业知识对商品进行分类。随着现代社会的发展,人们对分类的要求越来越高[1,2],仅依据经验和专业知识的分类已逐渐被淘汰,现在计算机技术被用于聚类分析,使用算法解决庞大而复杂的聚类任务[3,4]。因此,聚类算法已被提出并应用于各种场合[5,6]。此外,我们生活的海量数据世界也使得聚类过程不可或缺。许多研究领域都面临着海量数据的问题[7,8]。如果没有聚类或数据降维等预处理,很难进行后续分析[9–11]。例如在机器学习领域,几乎所有重要算法的原始入口都是大量的大规模数据,如果不进行聚类或降维,这些数据很难得到利用[12–14]。在量子通信领域,量子通信设备仅供应给少数几家大公司,量子通信中的很多方可能都是经典的,聚类算法可以帮助通信方更便捷地处理传输的信息[15–17]。在数据降维方面,我们熟悉的主成分分析算法(PCA)[18]、多维缩放(MDS)、线性判别(LDA)、局部线性嵌入(LLE)等[19–22]。但降维算法不可避免地会降低数据的属性值,如果操作不当,数据就会失去准确性,结果就会出现偏差,而使用聚类算法可以避免此类问题。目前,聚类算法可以按以下方式划分。基于分区的聚类算法包括 K 均值 [23]、K 中值 [24] 和核 K 均值算法 [25]。基于层次的聚类算法包括 BIRCH、CURE 和 CHAMELEON 算法 [26]。基于密度的聚类算法包括 DBSCAN、均值漂移 (MS) [27] 和密度峰值聚类算法 (DPC) [28]。每种算法都具有不同的分类能力。
对实验伪影和噪声敏感,从而降低了它们对具有相似定位但不同对比度的空间模式的泛化能力。最近,使用卷积神经网络 (CNN) 的迁移学习和半监督深度学习方法已经开发出来,分别用于聚类离子图像和量化分子共定位。26,27 这些报告表明,MSI 数据的有限大小对传统的 CNN 训练框架提出了挑战,因为传统的 CNN 训练框架通常依赖于大量带注释的图像。因此,这些方法与传统的机器学习方法相比,在查找共定位分子图像方面提供了相对较小的改进。计算机视觉自监督对比学习方法的最新进展,包括 MoCo、28 SimCLR 29
摘要 绝热量子计算机是一个有前途的平台,可以有效解决具有挑战性的优化问题。因此,许多人对使用这些计算机来训练计算成本高昂的机器学习模型感兴趣。我们提出了一种量子方法来解决 D-Wave 2000Q 绝热量子计算机上的平衡 k 均值聚类训练问题。为了做到这一点,我们将训练问题表述为二次无约束二元优化 (QUBO) 问题。与现有的经典算法不同,我们的 QUBO 公式针对平衡 k 均值模型的全局解。我们在许多小问题上测试了我们的方法,并观察到尽管 QUBO 公式具有理论上的优势,但现代量子计算机获得的聚类解决方案通常不如最佳经典聚类算法获得的解决方案。尽管如此,量子计算机提供的解决方案确实表现出一些有希望的特性。我们还进行了可扩展性研究,以估计使用未来量子硬件在大型问题上我们的方法的运行时间。作为概念的最终证明,我们使用量子方法对 Iris 基准数据集的随机子集进行聚类。
摘要:可再生能源(RESS)在能量混合中的渗透正在确定以分散功率产生为特征的能量情景。在Ress发电技术之间,太阳能光伏(PV)系统构成了非常有前途的选择,但是由于太阳能的间歇性质,它们的生产无法编程。PV设施与电池储能系统(BESS)之间的耦合允许在发电中实现更大的灵活性。但是,由于大量可能的配置,PV+Bess杂种植物的设计阶段具有挑战性。本文提出了一个初步程序,旨在预测一个适合与给定的PV植物配置结合的电池家族。提出的程序适用于建造的新假设工厂,以满足商业和工业负载的能源需求。根据对类似的实际植物进行的性能分析,估算了PV系统产生的能量。电池操作是通过分别调节电荷和放电的两个决策树样结构来建立的。最后,将无监督的聚类应用于所有可能的PV+Bess配置,以识别可行解决方案家族。
亲爱的编辑,迄今为止,已经评估了许多临床批准的药物治疗2019年冠状病毒病的潜力(Covid-19),例如lopinavir/ritonavir,hydroxychoroquine,cobicistat和darunavir。这些药物中的一些已被证明是有效的体外;但是,临床试验表明,这些化合物都没有导致症状或住院时间的显着改善。因此,从定义的目标开始识别候选药物是必不可少的,更可靠的。严重的急性呼吸综合征冠状病毒2(SARS-COV-2)主要蛋白酶M Pro(也称为3Cl蛋白酶)是冠状病毒中最典型的药物靶标之一。在当前的研究,基于SARS-COV-2 M Pro的两个不同结构(PDB ID:6LU7和6M2Q)的结构和序列比对中显示,Ser'46/Ca和Leu'167/Ca之间发生了明显的变化,这表明M Pro的底物结合袋在一定程度上表现出一定程度的灵活性(补充图。s1)。因此,我们使用这两种结构制定了一种多种互交策略,以使用Autodock Vina软件进行基于计算机的高通量虚拟筛选对药物数据库和我们的内部自动处理脚本的可能抑制剂(补充图。s2)。与这两种结构相对的108个分子分子<−8.0 kcal/mol发现。然后选择了相对于袋装体积和PKA值> 12的37个分子量在330至700 g/mol之间的分子。1 a)。2之后,我们专注于11种抗病毒,抗菌和靶向抗肿瘤药物(补充表1)。此外,还使用了几种先前报道的药物参考,例如GC376、1洛皮纳维尔,内菲尔纳纳维尔和达鲁纳维尔。全长SARS-COV-2 M Pro根据其编码序列(GI:1897214688)表达并纯化,并通过表面等离子体共振(SPR)技术检测到M Pro的每个筛选候选物的效率。使用Biacore仪器使用与M Pro相互作用的小分子的梯度浓度测量响应单元。然后,根据稳态分析,基于曲线拟合,测量了受体配体的结合属性,并报告为平衡解离常数(K d)。六种药物在M Pro中表现出极好的结合属性,包括Entretectinib,Indinavir,Cloxacillin,Dolutegravir,Saquinavir和Enasidenib,K D值为55μm或以下(图接下来,进行诱变研究以确认筛选分子与SARS-COV-2 m Pro之间相互作用的特定相互作用。首先,对可能与这些分子相互作用的七个残基的底物结合袋进行了深入分析,包括HIS41,ASN142,CYS145,CYS145,HIS164,MES165,ASP187和GLN189。HIS41,CYS145,HIS164和ASP187被报道为潜在的催化残基。
a 联合国际大学计算机科学与工程系,孟加拉国达卡巴达联合城,邮编 1212 b 斐济国立大学电气与电子工程学院,斐济苏瓦 c 格里斯大学集成与智能系统研究所,澳大利亚昆士兰州布里斯班 d 日本理化学研究所综合医学科学中心 e 斐济南太平洋大学 f 罗格斯大学计算机科学系,新泽西州卡姆登,邮编 08102,美国 g 罗格斯大学计算与综合生物学中心,新泽西州卡姆登,邮编 08102,美国
异质多尺度方法(HMM)能够同时使用Exascale超级计算机的出现,能够同时使用多个尺度模拟多个尺度。但是,幼稚的实现显示大量裁员,并且非常昂贵。宏观模型通常需要计算大量非常相似的显微镜模拟。在层次方法中,这几乎不是一个问题,因为现象学组成模型很便宜。但是,当微观模拟需要例如高维分子动力学(MD)或有限元(Fe)模拟时,必须避免冗余。我们提出了一种适用于HMM工作流的聚类算法,该算法会自动分类并消除冗余显微镜模拟。该算法具有条纹的组合,以呈现微观模拟的参数配置和基于其相似性的图网络表示的低维表示。该算法可以将相似的参数配置聚类为单个参数,以减少所需的显微镜模拟数量。我们描述了算法在HMM应用耦合Fe和MD的背景下的实现,以预测聚合物 - 透明烯纳米复合材料的化学机械行为。该算法提供了计算效果的三倍降低,准确性损失有限。
最新脑机接口的目的是通过为每个受试者定制识别器来实现准确的情绪识别。在机器学习领域,基于图的半监督学习 (GSSL) 因其直观且在情绪识别方面具有良好的学习性能而受到越来越多的关注。然而,现有的 GSSL 方法对噪声或基于异常脑电图 (EEG) 的数据很敏感或不够稳健,因为每个受试者在相同场景中可能呈现噪声或异常 EEG 模式。为了解决这个问题,在本文中,我们发明了一种基于 EEG 的情绪识别的可能性聚类促进半监督学习方法。具体而言,它限制每个实例具有与其局部加权均值相同的标签成员值,以提高识别方法的可靠性。另外,在目标函数中引入了关于模糊熵的正则化项,通过增加样本判别信息量来增强隶属函数的泛化能力,提高了方法对噪声和异常值的鲁棒性。在三个真实数据集(即DEAP、SEED和SEED-IV)上的大量实验结果表明,所提方法提高了基于脑电信号的情绪识别的可靠性和鲁棒性。