随着LHC过渡到精确测量机,质子Parton分布函数(PDFS)已成为分析的不确定性的主要来源,例如顶部夸克质量或HIGGS玻色子宽度的测量值。此外,在LHC处探测最有能力的碰撞时,高摩肌分数(High-X)尤其感兴趣。因此,在此制度中理解并有可能减少PDF不确定性至关重要。使用机器学习技术,我们构建了对High-X机制中Gluon PDF敏感的判别,将在将来的PDF拟合中使用。
摘要 先前的深度学习方法尚未捕获大脑结构或功能连接组数据的图形或网络表示。为了解决这个问题,我们通过将 BrainNetCNN 和全局协方差池化纳入自注意力机制,开发了 BrainNet-全局协方差池化-注意力卷积神经网络 (BrainNet-GA CNN)。从 171 名精神分裂症谱系障碍 (SSD) 患者和 161 名健康对照者 (HC) 获得了静息态功能磁共振成像数据。我们对提出的 BrainNet-GA CNN 进行了消融分析,并使用嵌套十倍交叉验证策略与竞争方法进行了定量性能比较。将我们的模型的性能与竞争方法进行了比较。使用基于梯度的解释方法可视化判别连接,并与使用功能连接分析获得的结果进行比较。BrainNet-GA CNN 的准确率为 83.13%,优于其他竞争方法。在前 10 个判别连接中,一些与默认模式网络和听觉网络有关。有趣的是,这些区域在功能连接分析中也很重要。我们的研究结果表明,提出的 BrainNet-GA CNN 可以比其他模型更准确地对 SSD 和 HC 患者进行分类。显着区域的可视化提供了重要的临床信息。这些结果突出了 BrainNet-GA CNN 在精神分裂症诊断中的潜在用途。关键词:脑网络、功能连接组、卷积神经网络、全局协方差池、自我注意机制、精神分裂症
正确且确定的脑肿瘤 MRI 分类在当前临床诊断、决策以及管理治疗方案中具有重要作用。在临床实践中,检查由专家通过视觉进行,这是一个劳动密集型且容易出错的过程。因此,需要基于计算机的系统来客观地执行此过程。在传统的机器学习方法中,提取并分类用于描述脑肿瘤 MRI 的低级和高级手工特征以克服上述缺点。考虑到深度学习的最新进展,我们在本研究中提出了一种新颖的卷积神经网络 (CNN) 模型,该模型结合了超列技术、预训练的 AlexNet 和 VGG-16 网络、递归特征消除 (RFE) 和支持向量机 (SVM)。所提模型的一大优势是,借助超列技术,它可以保留从深度架构不同层级的层中提取的局部判别特征。此外,所提模型通过融合从网络的最后全连接层获得的深度特征,充分利用了 AlexNet 和 VGG-16 网络的泛化能力。此外,使用 RFE 增强了所提模型的判别能力,从而揭示了最有效的深度特征。结果,所提模型在未使用任何手工制作的特征引擎的情况下获得了 96.77% 的准确率。确保了脑肿瘤 MRI 分类的全自动一致且有效的诊断模型。因此,所提模型有助于实现更客观的临床评估,支持专家的决策过程,并降低误诊率。
摘要:本文提出了一种针对不平衡数据的稳健加权评分 (ROWSU),用于在存在类别不平衡问题的高维基因表达二分类问题中选择最具判别性的特征。该方法解决了基因表达数据集中类别分布高度倾斜这一最具挑战性的问题之一,该问题会对分类算法的性能产生不利影响。首先,通过从少数类观测值中合成数据点来平衡训练数据集。其次,使用贪婪搜索方法选择最小基因子集。第三,引入一种新的加权稳健评分,其中权重由支持向量计算,以获得一组优化的基因。将基于该方法得分最高的基因与通过贪婪搜索方法选择的最小基因子集相结合,形成最终的基因集。即使在类别分布倾斜的情况下,新方法也能确保选择最具判别性的基因,从而提高分类器的性能。在6个基因表达数据集上评估了所提出的ROWSU方法的性能。以分类准确率和灵敏度作为性能指标,将所提出的ROWSU算法与其他几种最先进的方法进行比较。为了更好地理解结果,还绘制了箱线图和稳定性图。结果表明,所提出的方法优于现有的基于k近邻(kNN)和随机森林(RF)分类器分类性能的特征选择程序。
尽管深度神经网络推动了视觉识别任务的进步,但最近的证据表明,这些模型校准不佳,导致预测过于自信。在训练期间最小化交叉熵损失的标准做法促使预测的 softmax 概率与独热标签分配相匹配。然而,这会产生正确类别的预 softmax 激活,该激活明显大于其余激活,从而加剧了校准错误问题。最近从分类文献中观察到,嵌入隐式或显式最大化预测熵的损失函数可产生最先进的校准性能。尽管有这些发现,但这些损失在校准医学图像分割网络的相关任务中的影响仍未得到探索。在这项工作中,我们提供了当前最先进的校准损失的统一约束优化视角。具体来说,这些损失可以看作是线性惩罚(或拉格朗日项)的近似值,对 logit 距离施加了等式约束。这指出了这种底层等式约束的一个重要限制,其随后的梯度不断推向无信息解决方案,这可能会阻止在基于梯度的优化过程中在判别性能和模型校准之间达到最佳折衷。根据我们的观察,我们提出了一种基于不等式约束的简单而灵活的泛化方法,它对 logit 距离施加了一个可控的边际。在各种公共医学图像分割基准上进行的全面实验表明,我们的方法在网络校准方面为这些任务设定了新的最先进的结果,同时判别性能也得到了改善。代码可在 https://github.com/Bala93/MarginLoss 获得
巴西数据保护法 Lei Geral de Proteção de Dados Pessoais (LGPD) 旨在保护自由和隐私的基本权利以及人格的自由发展,同时以经济、技术发展和创新为基础。因此,技术创新必须与个人数据保护相协调。为了充分保护数据主体权利,有必要了解数据,特别是个人数据,在基于生成模型的人工智能中是如何处理的。生成方法不同于其他人工智能方法,因为它具有生成内容(数据)的能力,与判别方法相反,总之,判别方法允许系统学习如何根据所使用的数据做出决策。需要强调的是,人工智能这一表达目前用于指基于机器学习的人工智能系统。然而,人工智能是一个比机器学习更广泛的领域。就本文而言,这些术语将互换使用。为了更好地理解本文,有必要定义一些概念。第一个概念是人工智能,它可以定义为研究人工智能系统发展的人类知识领域。人工智能系统被定义为一种基于机器的系统,该系统针对明确或隐含的目标,从其接收的输入中推断如何生成输出,例如预测、内容、建议或决策。机器学习被定义为机器通过经验提高其执行任务的性能的能力,而深度学习是机器学习的一种变体,它使用多层以高精度解决更复杂的问题并在每层中转换数据。生成模型是一种能够通过采样生成新数据的概率模型,而提示被定义为用于向人工智能模型提供指令的文本输入。
脑机接口 (BCI) 分析个体与设备或外部环境直接交互的意图 (Wolpaw 等,2000)。个体的意图可以通过脑电图 (EEG) 来解码,脑电图由于其高时间分辨率、可靠性、可负担性和便携性而成为一种成熟的非侵入式技术。目前,由于机器学习和深度学习方法的发展,BCI 已经在辅助和临床领域得到应用。快速串行视觉呈现 (RSVP) 是在同一空间位置以每秒多张图像的高呈现速率顺序显示图像的过程。基于 RSVP 的脑机接口 (BCI) 是一种特殊类型的 BCI 系统 (Marathe 等,2016;Wu 等,2018)。它被证明是一种增强人机共生和人类潜能的可实现方法 (Manor 等,2016)。基于RSVP的BCI是基于人类视觉进行目标检测最常用的技术,其中使用的事件相关电位(ERP)是P300和N200(Wei等,2022)。人类视觉系统是一种非常复杂的信息处理机器。人类具有很强的学习、认知能力和敏感性,可以一眼就识别物体(Sajda等,2010)。因此,基于RSVP的BCI可以利用人类视觉的灵活性获得对环境的快速感知。当前的研究主要集中在提出适用于基于RSVP的BCI的更可靠、更有效的特征提取算法。由于其非平稳性和低信噪比(SNR),在RSVP任务中很难区分目标和非目标刺激。Sajda等人。 (2010 年)开发了一种分层判别成分分析(HDCA)算法,该算法采用 Fisher 线性判别(FLD)来计算空间域中的权重
摘要 一些系统评价强调了多种来源在精神疾病研究中的作用。对于 fMRI,最近的文献重点主要放在三个研究方面,即:功能连接、网络分析和频谱分析。数据由加州大学洛杉矶分校神经精神表型组学联盟收集。样本由 130 名神经典型者组成,其中 50 名被诊断患有精神分裂症,49 名患有躁郁症,43 名患有 ADHD。通过一种新方法(i-ECO)对每个感兴趣区域的结果进行平均,并通过加色法(RGB)降低单次 fMRI 扫描的维数:局部连接值(区域同质性)、网络中心性度量(特征向量中心性)、频谱维度(低频波动的分数幅度)。绘制并描述了每个诊断组的平均图像。通过使用卷积神经网络,探索了这种以综合方式可视化和分析 fMRI 结果的新方法的判别能力。i-ECO 的新方法显示了人眼可以轻松识别的组间差异。根据测试集(80/20 分割)的评估,我们模型的精确度-召回率曲线下面积 (PR-AUC) 对于每个诊断组均 > 84.5%。总之,本研究为 fMRI 结果的分析和可视化提供了一种综合且易于理解的方法。对精神疾病的判别能力很高。这项工作证明研究可用于研究更广泛的数据集的进一步发展,涵盖更广泛的精神疾病诊断。
背景:全球约 7% 的人口患有先天性血红蛋白疾病,每年有超过 300,000 例 β-地中海贫血新病例。在低收入地区,诊断成本高昂且不准确,通常依赖于全血细胞计数 (CBC) 测试。本研究采用机器学习 (ML) 根据性别和 CBC 对 β-地中海贫血特征进行分类,探索对无症状携带者和非携带者进行分组的影响。方法:数据集包括来自斯里兰卡的 288 名疑似 β-地中海贫血患者。使用 11 个判别公式和 9 个 ML 模型对其进行分类。使用马哈拉诺比斯距离去除异常值,并使用合成少数过采样技术 (SMOTE) 和 SMOTE- 名义连续 (NC) 进行重采样。Mann-Whitney U 检验处理特征提取和类别分组。使用八个标准评估 ML 性能。结果:Ehsani 公式通过将沉默携带者和非携带者分组,实现了 0.66 的受试者工作特征曲线下面积 (ROC-AUC)。未进行特征提取的卷积神经网络 (CNN) 表现出更好的性能,准确率为 0.85、灵敏度为 0.8、特异性为 0.86,ROC-AUC 为 0.95/0.93(微观/宏观)。即使没有预处理,性能也能保持。结论:在使用性别和 CBC 特征对 β - 地中海贫血进行分类时,ML 模型优于经典判别公式。更大的数据集可以增强 ML 模型的泛化能力和特征提取的影响。将沉默携带者和非携带者分组可改善 ML 结果,尤其是在重新采样的情况下。就可用特征而言,沉默携带者与非携带者无法区分。