摘要。是在增强学习中的剥削和勘探之间的权衡中的动机,我们研究了在跳跃存在下的连续时间熵调节的均值变化投资组合选择。我们为与表现出L'evy跳跃的多个风险资产相关的财富过程提供了探索性SDE。与现有文献相反,我们研究了与随机控制的财富过程的自然离散时间公式的限制行为,以得出连续的时间动力学。然后,我们表明,尽管处于跳跃模型中,但仍对连续时间熵进行的探索均值变化问题的最佳分布控制仍然是高斯。此外,各自的最佳财富过程求解了一个线性SDE,其表示明确获得。
大脑中的肿瘤是由大脑内组织细胞不受管制的出现引起的。早期诊断并确定磁共振成像中肿瘤的精确位置(MRI)及其大小对于医生团队至关重要。图像分割通常被认为是医学图像分析中的初步步骤。k均值聚类已被广泛用于脑肿瘤检测。此技术的结果是群集图像的列表。这种方法的挑战是选择描绘肿瘤的适当簇部分的困难。在这项工作中,我们分析了不同图像簇的影响。然后将每个群集分为左右部分。之后,每个部分中都描绘了纹理特征。此外,还采用双边对称度量来估计包含肿瘤的簇。最后,采用连接的组件标记来确定用于脑肿瘤检测的靶标簇。已开发的技术应用于30个MRI图像。获得了87%的鼓励精度。
这种疾病在人类中是普遍的。攻击人类的疾病不认识任何人,也不知道年龄。一个人所经历的疾病从普通水平开始,直到可能严重到处于死亡风险的地步。在这项研究中,进行了早期诊断与糖尿病有关的糖尿病是糖尿病是患者体内糖水平低于正常水平的疾病。受害人经历的症状包括频繁的口渴,尿液频繁,频繁饥饿和体重减轻。基于这些问题,需要一个系统可以快速发现患者所经历的诊断。这项研究旨在根据早期症状在早期诊断糖尿病。使用的方法是基于KNN和基于Web的模糊C均值。创建基于Web的系统可以代表医疗人员专家以快速诊断的糖尿病方法。该系统是嵌入糖尿病特征的计算机程序。测试KNN和模糊的C均应用程序的应用和方法对于K-最近的邻居方法的准确度为96%,而对于使用混淆矩阵计算的模糊C-Means方法,获得了96%的精确度,因此可以得出结论,因此可以得出结论,即Fuzzy C-Means方法比K-nearears方法更好。
摘要K -Means聚类算法是数据挖掘和未加剧的学习的主要内容,之所以受欢迎,是因为它易于实现,快速,易于并行化并提供直观的结果。劳埃德的算法是标准批量的爬山方法,用于最大程度地减少K-均值优化标准。它花费了大部分时间计算k群集中心和n个数据点之间的距离。事实证明,这项工作的大部分是不必要的,因为在第一次迭代之后,点通常会留在同一集群中。在过去的十年中,研究人员开发了许多优化,以加快劳埃德(Lloyd)的算法的低维数据和高维数据。在本章中,我们调查了其中一些优化,并提出了新的优化。特别是我们专注于避免通过三角形不等式计算距离的那些。通过缓存已知距离并用三角形不等式更新它们,这些算法可以避免许多不必要的距离计算。所检查的所有优化产生的结果与劳埃德的算法相同,给定的输入和初始化,因此适用于倒入替换。这些新算法的运行速度比标准未取代的实现更快,并且计算距离要少得多。在我们的实验中,与劳埃德算法相比,通常会看到超过30-50倍的加速度。我们研究了使用这些方法的示例n,dimensions d,簇K和数据结构的权衡。
摘要 近年来,我们目睹了全球越来越多的设备创建、捕获、复制和使用的数据不可阻挡地增长。对如此大量信息的处理需求促使人们研究更高的计算能力系统和专门的算法。其中,量子计算是一种基于量子理论的有前途的快速计算范式。在某些任务的计算复杂度方面,量子算法有望超越经典算法,机器学习就是其中之一,因此量子机器学习的子领域是最有前途的领域之一。在这项工作中,我们设计了一种用于 k-Means 的混合量子算法。我们算法的主要思想是以量子方式计算输入数据集中记录对之间的距离。我们表明,我们的量子算法原则上可以比经典的 k-Means 更高效,同时获得相当的聚类结果。
摘要 绝热量子计算机是一个有前途的平台,可以有效解决具有挑战性的优化问题。因此,许多人对使用这些计算机来训练计算成本高昂的机器学习模型感兴趣。我们提出了一种量子方法来解决 D-Wave 2000Q 绝热量子计算机上的平衡 k 均值聚类训练问题。为了做到这一点,我们将训练问题表述为二次无约束二元优化 (QUBO) 问题。与现有的经典算法不同,我们的 QUBO 公式针对平衡 k 均值模型的全局解。我们在许多小问题上测试了我们的方法,并观察到尽管 QUBO 公式具有理论上的优势,但现代量子计算机获得的聚类解决方案通常不如最佳经典聚类算法获得的解决方案。尽管如此,量子计算机提供的解决方案确实表现出一些有希望的特性。我们还进行了可扩展性研究,以估计使用未来量子硬件在大型问题上我们的方法的运行时间。作为概念的最终证明,我们使用量子方法对 Iris 基准数据集的随机子集进行聚类。
不同神经系统疾病引起的脑部异常状况影响着全世界的许多人。这些异常情况之一是肌萎缩侧索硬化症 (ALS)。 ALS 是一种俗称运动神经元病的疾病,它因脑干区域运动神经细胞受损而导致进行性身体障碍。大脑感知外界刺激,通过注意机制从大量的感知刺激中选取相关的刺激。注意力是当各种类型的信息、情绪和思想等活动集中在一个区域并由大脑在所需的时间内选择相关刺激时发生的认知过程。脑电图(EEG)在测量和分析大脑注意力机制中发生的此类活动方面具有重要地位。注意力分析的最新研究集中在事件相关电位 (ERP) 信号上。 EIP 信号是小幅度信号,其中包含 P100、N200、P300 和 N400 等在 EEG 信号中不太明显的成分。因此,为了获得 EIP 信号,必须重复目标刺激并多次进行 EEG 记录。 EEP 信号是通过对记录的目标刺激的 EEG 信号进行平均而获得的。研究的目的是从 ALS 患者和健康个体的 ERP 信号中获取一些特征,并使用 k-均值聚类方法检查对视觉刺激的注意力的分析。使用K均值聚类法进行分析的结果显示,数据被分为2个聚类,计算出最高成功率为77.78%。
回答传统英语教学能力评估算法中大数据信息不准确的分类问题,本文提出了基于大数据模糊K-Means Clustering的英语教学能力估计算法。首先,本文建立了约束参数索引分析模型。其次,定量递归分析用于评估大数据信息模型的功能,并实现功能约束特征信息的熵特征提取。最后,通过整合大数据信息融合和K-Means聚类算法,该文章可以实现用于英语教学能力的指标参数的聚类和集成,准备相应的教学资源分配计划,并评估英语教学能力。实验结果表明,使用此方法评估英语教学能力具有良好的信息融合分析能力,并提高了教学能力评估的准确性和教学资源应用的效率。
虽然通过正则化程序进行特征选择的问题在监督学习环境中引起了极大关注,并在过去二十年中产生了大量文献,但直到很晚且相对较新的时候,它才有效地出现在无监督框架中。第一种方法是基于模型的,这些方法自然适合包括套索(L 1)和相关惩罚,并且可以引用 [1] 来了解 L 1 惩罚的 EM 程序(混合由方差相等的高斯分布组成)或 [2] 来详细回顾基于模型的高维数据聚类。在更通用的框架中,没有对底层分布做出任何假设,在 [3] 中引入了具有 L 1 惩罚的稀疏 k 均值算法,后来扩展到每个聚类内的特征选择,并通过一致性结果得到加强,[4] [5] [6]。我们还要提到,最近在 [7] 中引入了稀疏 k 均值算法对重叠变量组的推广。话虽如此,上面引用的所有方法本质上都是为数值数据设计的,而真实数据通常由数值和分类特征组成。上面的一些作者触及了分类特征的问题,提到了使用虚拟变量进行转换使其数字化的可能性。但是,这个处理步骤并不是那么直接,因为零一向量上的欧几里得距离并不特别适合与数值变量上的欧几里得距离混合。其他作者
摘要 — 近年来,人们对利用基于脑电图 (EEG) 信号的深度学习模型监测癫痫患者的兴趣日益浓厚。然而,这些方法在应用于收集训练数据的环境之外时,往往表现出较差的泛化能力。此外,手动标记 EEG 信号是一个耗时的过程,需要专家分析,这使得将特定于患者的模型微调到新环境成为一项昂贵的任务。在这项工作中,我们提出了最大均值差异解码器 (M2D2),用于自动时间定位和标记长时间 EEG 记录中的癫痫发作,以协助医疗专家。我们表明,当对不同于训练数据的临床环境中收集的 EEG 数据进行评估时,M2D2 实现了 76.0% 和 70.4% 的时间定位 F1 分数。结果表明,M2D2 的泛化性能明显高于其他最先进的基于深度学习的方法。