iClusterBayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 iClusterPlus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... .................................................................................................................................................................................................. 18 simuResulttune.iClustertune.iClusterBayes .................................................................................................. .................................................................................................................................................................................................................................................................................................................. 20 tune.iClusterPlus .................................................................................................................................................................................................................................................................................................................................. 22 实用程序 .................................................................................................................................................................................................................................................................................................................................................. 22 实用程序 .................................................................................................................................................................................................................................................................................................................................................................. 23 24 variation.hg18.v10.nov.2010 . ...
摘要K -Means聚类算法是数据挖掘和未加剧的学习的主要内容,之所以受欢迎,是因为它易于实现,快速,易于并行化并提供直观的结果。劳埃德的算法是标准批量的爬山方法,用于最大程度地减少K-均值优化标准。它花费了大部分时间计算k群集中心和n个数据点之间的距离。事实证明,这项工作的大部分是不必要的,因为在第一次迭代之后,点通常会留在同一集群中。在过去的十年中,研究人员开发了许多优化,以加快劳埃德(Lloyd)的算法的低维数据和高维数据。在本章中,我们调查了其中一些优化,并提出了新的优化。特别是我们专注于避免通过三角形不等式计算距离的那些。通过缓存已知距离并用三角形不等式更新它们,这些算法可以避免许多不必要的距离计算。所检查的所有优化产生的结果与劳埃德的算法相同,给定的输入和初始化,因此适用于倒入替换。这些新算法的运行速度比标准未取代的实现更快,并且计算距离要少得多。在我们的实验中,与劳埃德算法相比,通常会看到超过30-50倍的加速度。我们研究了使用这些方法的示例n,dimensions d,簇K和数据结构的权衡。
这项工作的目的是研究基于集群的异常检测是否可以检测空中交通中的异常事件。正常模型适用于仅包含标记为正常的航班的数据。给定这个正常模型,调整异常检测函数,以便将与正常模型相似的数据点分类为正常,将异常的数据点分类为异常。由于数值数据的结构未知,因此测试了三种不同的聚类方法:K-means、高斯混合模型和谱聚类。根据正常模型的建模方式,使用不同的方法来调整检测函数,例如基于距离、概率,最后通过一类支持向量机。
我们表明,强的自旋三个中子 - 蛋白质相互作用会导致二极化质子发生在亚核密度和非零温度下的中子物质中。随着中子密度的增加,质子光谱从裸露的杂质到排斥的极性分支表现出平滑的交叉。该分支与一个有吸引力的极化分支共存。随着中子密度的增加,有吸引力的极性子在杜特隆形成方面变得稳定。对于两个相邻的质子,我们发现偏振子的影响和中子介导的吸引力足以诱导结合的二二二磷酸,这可能导致实验室和中子恒星中中子富含核的中子核心核中中子皮肤中的中子皮肤区域中的二溴二二磷酸形成。
描述了K均值,层次结合和DBSCAN聚类方法的实现功能数据,该方法允许共同对齐和聚类曲线。它支持在一维域上定义的功能数据,但可能在多元代码中进行评估。它支持在数组中定义的功能数据,也支持通过“ FD”和“ Fundata”类的功能数据,分别用于“ FDA”和“ Fundata”软件包中定义的功能数据。当前,它支持在实际线路上定义的功能数据的移位,扩张和仿射扭曲功能,并使用SRVF框架来处理在特定间隔上定义的功能数据的保存边界扭曲。K-Means算法的主要参考:Sangalli L.M.,Secchi P.,Vantini S.,Vitelli V.(2010)````k-mean for Curve clustering'''。SRVF框架的主要参考:Tucker,J。D.,Wu,W。,&Srivastava,A。(2013)``使用相位和振幅分离的功能数据生成模型''。
谱聚类是聚类无向图的一种常用方法,但将其扩展到有向图(有向图)则更具挑战性。一种典型的解决方法是简单地对称化有向图的邻接矩阵,但这可能会导致丢弃边方向性所携带的有价值信息。在本文中,我们提出了一个广义的谱聚类框架,可以处理有向图和无向图。我们的方法基于一个新泛函的谱松弛,我们将其引入为图函数的广义狄利克雷能量,关于图边上的任意正则化测度。我们还提出了一种由图上自然随机游走的迭代幂构建的正则化测度的实用参数化。我们提出了理论论据来解释我们的框架在非平衡类别的挑战性设置中的效率。使用从真实数据集构建的有向 K-NN 图进行的实验表明,我们的图分区方法在所有情况下均表现良好,并且在大多数情况下优于现有方法。
摘要 — 药物-靶标相互作用 (DTI) 预测在药物发现和化学基因组学研究中非常重要。机器学习,尤其是深度学习,在过去几年中极大地推动了这一领域的发展。然而,学术论文中报告的性能与实际药物发现环境中的性能之间存在显著差距,例如基于随机分割的评估策略在估计现实环境中的预测性能时往往过于乐观。这种性能差距主要是由于实验数据集中隐藏的数据偏差和不适当的数据分割。在本文中,我们构建了一个低偏差 DTI 数据集,并研究了更具挑战性的数据分割策略,以改进现实设置的性能评估。具体而言,我们研究了流行的 DTI 数据集 BindingDB 中的数据偏差,并使用五种不同的数据分割策略重新评估了三种最先进的深度学习模型的预测性能:随机分割、冷药分割、支架分割和两种基于层次聚类的分割。此外,我们全面检查了六个性能指标。我们的实验结果证实了流行的随机分割的过度乐观,并表明基于层次聚类的分割更具挑战性,并且可以在现实世界的 DTI 预测设置中提供对模型通用性的更有用的评估。索引术语——药物-靶标相互作用、数据偏差、数据分割策略、性能评估
大多数移动自组织网络 (MANET) 聚类协议中的簇头节点在管理路由信息方面发挥着重要作用。MANET 中聚类的可靠性、效率和可扩展性最终将受到极大影响。在这项工作中,我们建立了一种在 MANET 中形成簇的新方法,称为基于方形簇的路由协议 (SCBRP)。该协议基于复制理论。该协议的目标是在 MANET 中实现可靠性、可用性和可扩展性。通过使用 NS-3 模拟器进行性能分析来评估所提出的协议。性能表明,大型网络的数据传输率提高了 50%,网络稳定性和可用性也得到了改善,这反映在能耗测量中,系统寿命延长了 20%。
里程碑 6 目标:重新分析 BOSS 数据以了解超 LCDM(γ + 大质量中微子)以及第四阶段调查的预测 KPI:提交论文(arxiv:2306.09275)