情节选项BSline图最佳分数参考线BSlineOpts(行选项)会影响最佳分数参考线线路线群(线选项)影响所有培训,验证和交叉验证曲线的演绎trainlineOpts(线路选项)(线选项)影响培训曲线的训练曲线(线路选项)影响CREDITION cORTIEN cORTINTION cORTIENT cORITION cORITION cORITION cORTINITION cORVINITION CERVINITION CERVINE cUROPTERVERINITION CERVINE cUREOP(线条(线条)(线条(交叉验证曲线cVlineOpts(行选项)影响交叉验证曲线NOCVTRAINSD的演绎,并未绘制用于训练交叉验证曲线CVTRAINSDOPTS(区域选项)的标准偏差频段(区域选项)会影响标准偏差范围内的标准偏差范围训练的范围差异范围差异。 CVSDOPT(区域选项)会影响跨验证曲线的标准偏差频段的演绎twOWay选项,除了(在)
图 1. 用于优化每个参与者个性化分类器的分析程序。原始 EEG 数据经过频谱分析。计算 MEP 振幅并通过中值分割分为小 MEP 和大 MEP。之后,通过拟合 100 个不同的 lambda 值和 168 个不同的特征数的 LDA 分类器执行 5 倍交叉验证网格搜索,并按重要性顺序添加特征。然后,选择每个参与者表现最佳的交叉验证分类器,并使用交叉验证期间获得的每个预测类的真实 MEP 振幅计算预测的 MEP 振幅调制。对于每个参与者,在优化和分类循环中训练和测试 16,800 个分类器,这在标准笔记本电脑上需要约 4 分钟。
摘要:在被动 BCI 研究中,一种常见的方法是在相对较长的试验期间收集感兴趣的心理状态数据,并将这些试验划分为较短的“时期”,以作为分类中的单个样本。虽然众所周知,在这种情况下使用 k 倍交叉验证 (CV) 会导致心理状态可分离性的估计不可靠(由于来自同一试验的样本存在自相关),但 k 倍 CV 仍在被动 BCI 研究中广泛使用和报告。尚不清楚的是 k 倍 CV 在多大程度上歪曲了真正的心理状态可分离性。这使得很难解释使用它的研究结果。此外,如果清楚地知道问题的严重性,也许更多的研究人员会意识到他们应该避免它。在这项工作中,一个新颖的实验探索了类内样本之间的相关程度如何影响通过 k 倍 CV 估计的基于 EEG 的心理状态分类准确性。将结果与真实值 (GT) 准确度和“块级”CV(k 折的替代方法,旨在缓解自相关问题)进行了比较。还探讨了诸如真实类别可分度以及使用的特征集和分类器等因素。结果表明,在某些条件下,k 折 CV 使 GT 分类准确度增加高达 25%,但块级 CV 低估了 GT 准确度高达 11%。我们建议,在单受试者分析中,应尽可能减少来自同一次试验的样本数量,并报告 k 折和块级 CV 结果。
受试者和HBO/HBR-WISE分类模型嵌套的交叉验证具有超参数优化(5倍折叠à20次重复)公制AUC-ROC经验机会水平估计的经验机会水平估计了使用假人分类器分类器:线性判别分析(LDA),STER(LDA)(SSV MACHICER)(s vecter)(s vector)(s vecter)(范围)。平均,最大,最小,峰值2Peak,斜率,Time2Peak评估:交叉验证折叠上的自举以估计平均值及其置信区间
所提方法的计算成本取决于我们需要计算 ˜ π i 的观测总数,因此在大多数情况下,计算 ˜ π 将占主导地位。这使得了解这些成本与似然函数 P 中的参数总数(而不是模型中的参数总数)和后验抽取总数 S 的关系变得很重要。表 1 列出了所提出的不同近似值的总体成本。计算完整的 PSIS-LOO 的成本为 O(nPS),因为对数似然的评估与 P 是线性的,即与 WAIC 的复杂度相同,但常数更大。可以根据特定似然做出不同的权衡,其中近似成本范围从最便宜的 plpd 到最昂贵的 WAIC/TIS(具有大量后验抽取 S)。 plpd 仅计算一次对数似然,而完整的 WAIC/TIS 方法需要计算 S 次。
摘要 为了提高学生成绩,许多大学使用机器学习来分析和评估他们的数据,从而提高大学的教育质量。为了从追踪研究数据集中获得新的见解,即大学成绩与学生在商业和行业工作能力之间的相关性,作者将使用人工神经网络 (ANN) 开发一个基于追踪研究数据集预测学生成绩的模型。为了获得与标签相对应的属性,将使用 Phi 系数相关来选择具有高相关性的属性作为特征选择。作者还使用合成少数过采样技术 (SMOTE) 执行过采样方法,因为这个数据集是不平衡的,并使用 K 折交叉验证评估模型。根据 K 折交叉验证,结果表明 K = 3 的评估分数标准差较低,是分割数据集的最佳 K 候选者。所有分数评估(准确度、精确度、召回率和 F-1 分数)的平均标准差为 0.038。将 SMOTE 应用于不平衡数据集(数据分为 65 个训练数据和 35 个测试数据)后,准确率值从 0.77 提高到 0.87,提高了 10%。关键词:人工神经网络、不平衡数据集、K 折交叉验证、学生表现、追踪研究。引言
高光谱成像和人工神经网络(ANN)的结合可以预测果实的成熟度。这项工作调查了使用K折的交叉验证方法的高光谱成像和ANN模型的应用,用于成熟度预测油棕新鲜水果束(FFB),以进行内部分类和分级机器视觉。粗棕榈油(CPO)是印度尼西亚和马来西亚等国家的出口商品。油棕FFB成熟度决定了CPO的质量。FFB的独特形状和颜色需要创新的方法来代替繁琐而繁琐的手动分类和分级。这项研究中使用的油棕FFB样品先前是根据颜色和果实的果实分类的。,我们在用于ANN模型和混淆矩阵之前,应用了高光谱数据集的Savitzky-Golay(SG)平滑滤波器和7倍的交叉验证,以找到ANN模型的精度。我们从523个数据点中获得了SG过滤器后的72个数据点。预测结果显示平均准确度为79.48%,其中三个折叠为2、5和7的倍数给出了90%的最高精度。结果证实了高光谱成像的潜在用途,k折交叉验证和ANN模型以进行油棕FFB的成熟度预测。
在这项研究中,使用了1D CNN方法。研究中提出的1D CNN结构设计用于对ALS患者和健康个体的分类,而无需进行任何手动特征选择和提取。所提出的1D-CNN结构如图5所示。此体系结构由三个卷积层组成,一个最大式层,三个relu层,两个完全连接的层,一个辍学层和一个软磁层。每个卷积层的内核分别为36、18和9。此外,第一个完全连接的层部分中有500个退出,而2个完全连接的层部分中的类别的出口和2个出口一样多。在提出的体系结构的最后一层中,使用了SoftMax激活函数。在拟议的模型中,将网络训练的学习率设置为0.001,将辍学设置为0.5。在输入层上应用的数据具有256x1样品长度。在分类过程中,测试网络时使用了5倍的交叉验证和10倍的交叉验证。在此过程中,对于5倍交叉验证,将数据集随机分为相同长度的五个,每个分隔
摘要 - 目的:杂音是心脏异常的声音,由专家通过心脏听觉确定。杂音级是杂音强度的定量度量,与患者的临床状况密切相关。这项工作旨在估计来自多个听诊位置的每个患者的杂音级(即缺乏,柔软,响亮),这些位置来自低资源农村地区的大量儿科患者。方法:每个PCG记录的MEL频谱图表示具有15个卷积残留神经网络的集合,具有通道注意机制,以对每个PCG记录进行分类。根据提议的决策规则得出每个患者的最终杂音等级,并考虑所有可用记录的估计标签。使用分层十倍的交叉验证,该方法在由1007名患者的3456个PCG记录组成的数据集上进行了交叉验证。此外,该方法是在由442名患者的1538个PCG记录组成的隐藏测试集上进行了测试。结果:就未加权的敏感性和F1分数而言,患者级杂音等级的总体交叉验证性能分别为86.3%和81.6%。缺乏,柔软和大声杂音的敏感性(和F1分数)为90.7%(93.6%),75.8%(66.8%)和92.3%(84.2%),
摘要:脑肿瘤的分类是通过活检进行的,而活检通常不会在确定性脑外科手术之前进行。技术和机器学习的改进可以帮助放射科医生进行非侵入性肿瘤诊断。在图像分割和分类方面取得显著成果的机器学习算法是卷积神经网络 (CNN)。我们提出了一种新的 CNN 架构,用于对三种类型的脑肿瘤进行分类。开发的网络比现有的预训练网络更简单,并在 T1 加权对比增强磁共振图像上进行了测试。使用四种方法评估网络的性能:两种 10 倍交叉验证方法和两个数据库的组合。使用其中一种 10 倍方法、逐个主题的交叉验证测试了网络的泛化能力,并使用增强图像数据库测试了改进情况。对于增强数据集的记录式交叉验证,10 倍交叉验证法获得了最佳结果,在这种情况下,准确率为 96.56%。新开发的 CNN 架构具有良好的泛化能力和良好的执行速度,可用作医学诊断中放射科医生的有效决策支持工具。