多标签属性识别是计算机视觉中的一项关键任务,应用程序范围在不同的领域。这个问题通常涉及检测具有多个属性的对象,需要具有高级差异和精细的特征提取的复杂模型。对象检测和属性识别的集成通常依赖于诸如双阶段网络之类的方法,其中准确的预测取决于高级特征提取技术,例如感兴趣的区域(ROI)池。为了满足这些要求,在统一框架中既可以实现可靠的检测和属性进行分类,这是必不可少的。这项研究介绍了一个创新的MTL框架,旨在将多人属性识别(MPAR)纳入单模型体系结构中。命名为MPAR-RCNN,该框架通过空间意识到的,共享的骨干,促进效果和准确的多标签预测来符合对象检测和属性识别任务。与传统的基于快速区域的卷积神经网络(R-CNN)不同,该网络(R-CNN)分别管理人的检测和归因于双阶段网络的分类,MPAR-RCNN体系结构在单个结构中优化了两个任务。在更宽的(用于事件识别的Web图像数据集)数据集上进行了验证,提出的模型展示了对当前最新ART(SOTA)体系结构的改进,展示了其在推进多标签属性识别方面的潜力。
海马在情节记忆中起关键作用。此外,少量但越来越多的研究表明,这也有助于解决响应冲突。尚不清楚这两个功能是如何相关的,以及它们如何受到颞叶叶癫痫(MTLE)患者海马病变的影响。先前的研究表明,冲突刺激可能会更好地记住,但是海马对于支持冲突处理与记忆形成之间的这种相互作用至关重要。在这里,我们由于海马硬化症和19例匹配的健康对照,测试了19例MTLE患者。参与者在功能性磁共振成像(fMRI)期间执行了面对面的stroop任务,然后对面部进行了识别任务。我们测试了与长期记忆有关的大脑区域的记忆力和活动是否受编码过程中的冲突调节,以及MTLE患者和对照组之间是否有所不同。在控件中,我们在很大程度上复制了对冲突刺激的记忆力改善的先前发现。MTLE患者在冲突试验期间也显示出缓慢的反应时间,但他们没有表现出记忆益处。在控制中,在关注的海马区域内相互作用的冲突解决和记忆的神经活动。在这里,在不一致的试验中,左海马招募对记忆性能的效率低于一致试验,这表明对有限的资源进行了汉普坎普的竞争。他们也
功能大脑网络(FBN)分析表明,在识别脑部疾病(例如阿尔茨海默氏病(AD)及其前驱阶段,即轻度认知障碍(MCI))方面具有巨大潜力。必须从功能大脑网络中识别歧视性和可解释的特征,以提高分类性能并帮助我们理解与广告相关的脑疾病的病理机制。以前的研究通常从FBN提取节点统计或边缘权重来表示每个受试者。但是,这些方法通常忽略了FBN的拓扑结构(例如模块化)。为了解决此问题,我们提出了一个模块化 - LASSO特征选择(MLFS)框架,该框架可以明确对模块化信息进行建模,以识别FBN的歧视性和可解释功能,以进行自动化AD/MCI分类。特别是,提出的MLFS方法首先通过签名的光谱群集算法搜索FBN的模块化结构,然后通过模块化诱导的组LASSO方法选择判别特征,然后使用支持向量机(SVM)进行分类。为了评估所提出的方法的有效性,对公共ADNI数据库的563个静止状态功能性MRI扫描进行了广泛的实验,以识别正常对照的AD/MCI的受试者,并预测MCI受试者的未来进展。实验结果表明,我们的方法在AD/MCI识别任务和MCI转换预测的两个任务中都优于以前的方法,还有助于发现与AD相关的歧视性脑区域和功能连接性。
视觉的深度前馈神经网络模型在计算神经科学和工程领域都占据主导地位。相比之下,灵长类动物的视觉系统包含丰富的循环连接。循环信号流能够随着时间的推移回收有限的计算资源,因此可能会提高物理上有限的大脑或模型的性能。这里我们展示:(1)在自然图像的大规模视觉识别任务中,循环卷积神经网络模型的表现优于参数数量匹配的前馈卷积模型。(2)设置一个置信度阈值,在该阈值处,循环计算终止并做出决策,可以灵活地以速度换取准确性。在给定的置信度阈值下,该模型会在更难识别的图像上花费更多的时间和精力,而无需额外的参数进行更深入的计算。(3)与几个参数匹配和最先进的前馈模型相比,循环模型对图像的反应时间可以更好地预测人类对同一图像的反应时间。 (4) 在置信度阈值范围内,循环模型模拟了前馈控制模型的行为,因为它以大致相同的计算成本(浮点运算的平均次数)实现了相同的精度。但是,循环模型可以运行更长时间(更高的置信度阈值),然后胜过参数匹配的前馈比较模型。这些结果表明,作为生物视觉系统的标志,循环连接对于理解人类视觉识别的准确性、灵活性和动态性可能至关重要。
人工智能(AI),更具体地说,深度学习,彻底改变了包括医疗保健在内的许多领域。卷积神经网络(CNNS)是一种尤其是熟悉图像识别任务的一种深度学习模型,在医学诊断方面表现出了巨大的希望,尤其是在皮肤病学方面。皮肤疾病诊断在很大程度上取决于视觉评估,使其成为通过AI自动化的理想候选者。通过利用CNN,可以根据图像对皮肤病进行分类,从而更快,更准确地诊断过程。这项研究重点是开发基于Web的皮肤病检测和分类系统,集成了CNN以使诊断过程自动化。用户,包括患者和医疗专业人员,可以上传或捕获皮肤病变的图像,然后通过在皮肤病学数据集中培训的CNN模型对其进行实时分析。该系统不仅可以识别皮肤状况,而且还提出了潜在的治疗方法,提供了可以指导进一步医疗咨询的初步诊断。这项研究的主要目标是创建一个可访问的,用户友好的平台,该平台可以用作诊断工具和教育资源。通过对皮肤疾病的初步评估自动化,该系统旨在弥合患者和皮肤科医生之间的差距,尤其是在稀缺医疗保健服务的地区。本文概述了系统的开发过程,CNN模型架构和所使用的技术框架,同时还与现有的皮肤病检测方法进行了详细的比较。
1a.一般安全要求和指导(仅限国防部组件):下文所述的安全要求适用于支持本合同履行要求的所有合同人员(包括总承包商(“承包商”)的员工和所有分包商员工)。承包商负责遵守这些安全要求。有关安全问题的问题应向指定的政府代表提出(例如,合同官员代表 (COR)、需求活动 (RA) 代表或合同官员(如果未任命 COR 或其他 RA 代表))。下文规定的国防部 (DoD) 和服务特定安全要求(如果适用)是履行要求。所有合同人员应在合同授予后 30 天内或新合同人员开始履行合同之日起完成适用的初始培训。承包商应根据适用的 RA 政策保存安全培训记录。进入联邦设施时,承包商人员和车辆必须接受搜查。此外,所有合同人员均应遵守武力保护条件 (FPCON) 措施、随机反恐措施(通常称为“RAM”)和健康保护条件 (HPCON) 措施。承包商负责根据适用的 RA 计划和程序在安全级别提高期间满足性能要求 - 包括识别任务必需和非任务必需人员。除了本合同变更条款授权的变更外,如果任何单个设施或设施的 FPCON 或 HPCON 级别发生变化,政府可能会实施影响合同人员的安全变更。承包商应确保所有合同人员了解其安全责任,包括当地政策或程序中确定的任何特定于站点的要求。
尽管深度神经网络推动了视觉识别任务的进步,但最近的证据表明,这些模型校准不佳,导致预测过于自信。在训练期间最小化交叉熵损失的标准做法促使预测的 softmax 概率与独热标签分配相匹配。然而,这会产生正确类别的预 softmax 激活,该激活明显大于其余激活,从而加剧了校准错误问题。最近从分类文献中观察到,嵌入隐式或显式最大化预测熵的损失函数可产生最先进的校准性能。尽管有这些发现,但这些损失在校准医学图像分割网络的相关任务中的影响仍未得到探索。在这项工作中,我们提供了当前最先进的校准损失的统一约束优化视角。具体来说,这些损失可以看作是线性惩罚(或拉格朗日项)的近似值,对 logit 距离施加了等式约束。这指出了这种底层等式约束的一个重要限制,其随后的梯度不断推向无信息解决方案,这可能会阻止在基于梯度的优化过程中在判别性能和模型校准之间达到最佳折衷。根据我们的观察,我们提出了一种基于不等式约束的简单而灵活的泛化方法,它对 logit 距离施加了一个可控的边际。在各种公共医学图像分割基准上进行的全面实验表明,我们的方法在网络校准方面为这些任务设定了新的最先进的结果,同时判别性能也得到了改善。代码可在 https://github.com/Bala93/MarginLoss 获得
摘要 — 监测麻醉期间的意识深度对于临床环境和神经科学研究都有助于了解大脑机制。脑电图 (EEG) 已被用作实时表征麻醉剂引起的大脑改变的唤醒和/或认知状态的客观手段。不同的全身麻醉剂以不同的方式影响脑电活动。然而,由于 EEG 信号的信噪比 (SNR) 低,尤其是在办公室麻醉 EEG 环境中,传统机器学习模型在 EEG 数据上的表现并不令人满意。深度学习模型因其良好的泛化和处理噪声的能力而被广泛应用于脑机接口 (BCI) 领域以执行分类和模式识别任务。与其他深度学习已显示出令人鼓舞的结果的 BCI 应用相比,用于对麻醉下不同大脑意识状态进行分类的深度学习方法的研究要少得多。在本文中,我们提出了一种基于元学习的新框架,使用深度神经网络对麻醉状态下的大脑状态进行分类,即 Anes-MetaNet。Anes-MetaNet 由卷积神经网络 (CNN) 组成,用于提取功率谱特征,基于长短期记忆 (LSTM) 网络的时间后果模型用于捕获时间依赖性,以及元学习框架用于处理跨主体的大量差异。我们使用多阶段训练范例来提高性能,这可以通过可视化高级特征映射来证明。通过与现有方法进行比较,在办公室麻醉脑电图数据集上进行的实验证明了我们提出的 Anes-MetaNet 的有效性。
了解第二语言(L2)学习者所面临的挑战对于有效的语言获取至关重要。这项研究调查了夸张的声学特性对促进英语说话者的普通话学习的影响。使用合成的音调刺激,我们通过三个关键修改系统地操纵了音高轮廓:扩展基本频率(F0),增加F0(女性语音)并延长整体持续时间。我们的目标是评估F0扩展,较高的F0,更长的持续时间以及各种音节对普通话的学习和概括的影响。参与者从事非自适应试用语调识别任务。混合效应逻辑回归模型用于分析学习阶段,声学因素和色调的准确性。的发现揭示了从训练到测试和概括阶段的准确性提高,表明感知训练对成人说英语的人的音调有效。音调1的出现是最容易感知的,而音调3则构成了最挑战,与既定的色调获取难度层次结构一致。对声学因子的分析突出了特定于音调的效果。扩展的F0对识别音调2和音调3是有益的,但对音调1和音调4。此外,较长的持续时间也表现出各种色调的各种效果,有助于识别音调3和音调4但阻碍音调1的识别。较高的F0对于音调2是有利的,但对于音调3。此外,音节MA促进了音调1和音调2的识别,但对于音调3和音调4。这些发现增强了我们对声学特性在L2音调感知中的作用的理解,并对设计有效的培训计划的设计有影响。
1a.一般安全要求和指导(仅限国防部组件):下文所述的安全要求适用于支持本合同履行要求的所有合同人员(包括总承包商(“承包商”)的员工和所有分包商员工)。承包商负责遵守这些安全要求。有关安全问题的问题应向指定的政府代表提出(例如,合同官员代表 (COR)、需求活动 (RA) 代表或合同官员(如果未任命 COR 或其他 RA 代表))。下文规定的国防部 (DoD) 和服务特定安全要求(如果适用)是履行要求。所有合同人员应在合同授予后 30 天内或新合同人员开始履行合同之日起完成适用的初始培训。承包商应根据适用的 RA 政策保存安全培训记录。进入联邦设施时,承包商人员和车辆必须接受搜查。此外,所有合同人员均应遵守武力保护条件 (FPCON) 措施、随机反恐措施(通常称为“RAM”)和健康保护条件 (HPCON) 措施。承包商负责根据适用的 RA 计划和程序在安全级别提高期间满足性能要求 - 包括识别任务必需和非任务必需人员。除了本合同变更条款授权的变更外,如果任何单个设施或设施的 FPCON 或 HPCON 级别发生变化,政府可能会实施影响合同人员的安全变更。承包商应确保所有合同人员了解其安全责任,包括当地政策或程序中确定的任何特定于站点的要求。