机器学习模型很难推广到它们所训练的分布之外的数据。特别是,视觉模型通常容易受到对抗性攻击或常见损坏的影响,而人类视觉系统对此具有鲁棒性。最近的研究发现,将机器学习模型正则化以支持类似大脑的表示可以提高模型的鲁棒性,但原因尚不清楚。我们假设模型鲁棒性的提高部分归因于从神经表征中继承的低空间频率偏好。我们通过几种频率导向分析测试了这个简单的假设,包括设计和使用混合图像来直接探测模型频率敏感性。我们还研究了许多其他公开可用的鲁棒模型,这些模型是在对抗性图像或数据增强上训练的,发现所有这些鲁棒模型都表现出对低空间频率信息的更大偏好。我们表明,通过模糊进行预处理可以作为防御对抗性攻击和常见损坏的机制,进一步证实了我们的假设并证明了低空间频率信息在鲁棒物体识别中的效用。
。CC-BY-NC-ND 4.0 国际许可证(未经同行评审认证)是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是此预印本的版权持有者此版本于 2025 年 2 月 4 日发布。;https://doi.org/10.1101/2024.09.30.614878 doi:bioRxiv 预印本
摘要 — 在本文中,提出了一种自动识别心理工作量相对变化的新解决方案。使用可穿戴传感器收集 26 名人类受试者在执行三个难度级别 n ∈{1, 2, 3} 的 n-back 任务时的 EEG、EDA、PPG 和眼动追踪数据。目标是通过将当前信号窗口与前一个信号窗口进行比较来识别心理工作量是增加、减少还是稳定。所提出的三类分类器主要使用 CNN 层和新颖的合并层,该合并层系统地捕获两个检查窗口的局部段之间的相互作用。事实上,它受到了基于 Transformer 和 CNN 的网络在时间序列分类方面的竞争成功的启发。在所提出的解决方案利用了 CNN 网络的效率的同时,由于提出了合并层,它还与 Transformer 类似,具有捕获序列局部事件之间相互作用的能力。在准确性方面,实验结果表明,在眼球方向、PPG 和 EEG 数据上,所提出的解决方案优于经典 CNN、BiLSTM 和 transformer 网络,而在眼球瞳孔直径和 EDA 数据上,其性能与 transformer 网络相当。实验结果显示,每个时期的平均训练时间明显小于 transformer 和 BiLSTM 网络。索引术语——心理工作量 (MWL)、深度神经网络 (DNN)、时间序列分类 (TSC)、眼动追踪、光电容积图 (PPG)、脑电图 (EEG)、皮肤电活动 (EDA)、n-back 任务、transformer 神经网络、卷积神经网络 (CNN)。
抽象大多数自动表达分析系统试图识别一系列传统的表达方式,例如幸福,悲伤,愤怒,惊喜和恐惧等。尽管这套表达方式是面部最典型的表达式,但它与身体表达式所告诉我们的内容并不是最代表性/相关的。本文提出了一种新颖而通用的方法,用于使用人类姿势识别身体表情。我们的方法基于给定表达式产生的中性运动的概念。第二次,我们估计残基函数,作为两个相关运动之间的差异,即表达式和中性运动。更准确地说,受心理学领域研究启发的此功能给出了运动的“中立性”得分。使用此“中立分数”,我们提出了一个成本函数,该成本函数能够从任何输入表达运动中综合中性运动。中性运动过程的合成基于两个嵌套的主成分分析,提供了一个可以移动和选择现实的人类动画的空间。在具有异质运动和身体表达的四个数据库上评估了拟议的方法,并在超过艺术状态的身体表达识别方面获得了识别结果。
弗伦纳(Sillja); imke酸;埃琳娜·朗戈(Elena Longo):《同步辐射杂志》 2022年1月发行的封面是论文的亮点:S。Flenner,S。Bruns,E。Longo,A.J。Parnell,K.E。 Stockhausen,M。Müller,I。Greving:“机器学习高分辨率X射线纳米摄影数据的降级” J.Synchrotron辐射29(2022)230-238 doi:10.1107/s160057752111111139(20222)(2022)(2022)Parnell,K.E。Stockhausen,M。Müller,I。Greving:“机器学习高分辨率X射线纳米摄影数据的降级” J.Synchrotron辐射29(2022)230-238 doi:10.1107/s160057752111111139(20222)(2022)(2022)
摘要。语音情绪识别(SER)是一个跨学科领域,利用信号处理和机器学习技术来识别和分类通过语音传达的情绪。近年来,由于其在人类计算机互动,医疗保健,教育和客户服务中的潜在应用,SER引起了极大的关注。可以从各种声学特征中推断出幸福,愤怒,悲伤,恐惧,惊喜和厌恶等情绪,包括音高,强度,语音速度和光谱特征。然而,由于诸如说话者的可变性,文化差异,背景噪声和情绪表达的微妙之处等因素,准确地识别语音的情绪是具有挑战性的。本文探讨了语音情感识别的最新方法,重点是深度学习方法,特征提取技术以及使用大规模情感标记的数据集。我们回顾了传统的方法,例如隐藏的马尔可夫模型和支持向量机,并将其与神经网络(尤其是卷积神经网络(CNN))和复发性神经网络(RNN)(RNN)中的现代进步进行比较。此外,我们讨论了该领域的挑战,包括自发言语中的情感检测,跨语性和跨文化识别的影响以及当前基准的局限性。最后,我们提供了SER系统的现实应用程序的概述,包括它们集成到虚拟助手,心理健康诊断和互动娱乐中。我们通过强调多模式情绪识别的新兴趋势,以及未来研究的潜力,以提高不同环境中SER系统的鲁棒性和准确性。
本文介绍了基于尖端的面部识别出勤系统,旨在通过整合高级机器学习,计算机视觉和地理空间API来解决传统出勤方法的局限性。系统通过高精度和效率自动化与会者的识别和记录来简化出勤过程。关键功能包括用于实时面部识别的实时视频识别,一个用于注册新个人的直觉用户注册模块,基于CSV的无缝数据导出和管理的日志记录以及地理位置感知到的出勤跟踪,以确保记录不仅是时间含量的,而且是位置特定的。这种地理空间上下文提供了宝贵的见解,尤其是对于分布式团队或多站点设置。
Noninvasive Cardiology Cardiovascular Disease Nuclear Cardiology Cardiovascular Disease Diagnostic Radiology Nuclear Medicine Preventive Cardiology Cardiovascular Disease Pulmonary Vascular Disease Cardiovascular disease Sports Cardiology Cardiovascular disease Vascular Anomalies Cardiovascular Disease Vascular Surgery Vascular Brachytherapy Cardiovascular Disease Vascular Medicine Cardiovascular Disease Internal Medicine Pulmonary Disease肺部疾病和重症医学儿科咨询精神病学儿童和青少年精神病学咨询 - 精神病学精神病学儿科心理药物学儿童和青少年精神病学临床磁脑脑力学和神经外神经外科神经外科治疗儿童癫痫儿童癫痫症治疗儿童神经神经病学儿童学神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经神经疗法儿童神经病学新生儿 - 上世医学新生儿神经病学和脑发育儿童神经病学儿童新生儿 - 上期医学儿科儿科脑血管神经病学儿童神经病学临床神经物理学儿童神经病学儿童神经病学儿童学障碍儿童运动障碍儿童运动障碍儿童神经儿童病学分裂儿童病学
不平衡的数据集对神经科学、认知科学和医学诊断等领域构成了重大挑战,在这些领域中,准确检测少数类别对于稳健的模型性能至关重要。本研究以 DEAP 数据集中的“喜欢”标签为例,解决了类别不平衡问题。这种不平衡经常被先前的研究忽视,这些研究通常侧重于更平衡的唤醒和效价标签,并主要使用准确度指标来衡量模型性能。为了解决这个问题,我们采用了旨在最大化曲线下面积 (AUC) 的数值优化技术,从而增强了对代表性不足的类别的检测。我们的方法从线性分类器开始,与传统的线性分类器(包括逻辑回归和支持向量机 (SVM))进行了比较。我们的方法明显优于这些模型,召回率从 41.6% 提高到 79.7%,F1 分数从 0.506 提高到 0.632。这些结果强调了通过数值优化实现 AUC 最大化在管理不平衡数据集中的有效性,为提高在样本外数据集中检测少数但关键类别的预测准确性提供了有效的解决方案。
大多数日常活动需要灵巧地使用手和手指。残疾人的手部假肢可以通过连接到上肢的表面电极非侵入式获取的表面肌电图 (sEMG) 信号来控制。在对从 10 位截肢者获取的 12 个电极 sEMG 信号进行预处理后,计算了时域和频域中的不同特征。考虑到 sEMG 是一种复杂、随机、非平稳和非线性信号,还通过多重分形去趋势波动分析 (MFDFA) 的方法提取了复杂的非线性特征。使用不同的分类方法(包括支持向量机 (SVM)、线性判别分析 (LDA) 和多层感知器 (MLP))来比较它们在八种不同手指运动分类中的表现。观察发现,SVM 在手指运动分类方面的表现优于其他两个分类器。新特征与传统特征融合后,分类准确率、精确率、召回率(灵敏度)分别为98.70%、98.74%、98.67%。结果表明,加入MFDFA提取的新特征与其他传统特征,可以有效提高数据采集效果。