Methods: This paper aims at the problem of target detection of Yunnan Xiaomila under complex background environment, in order to reduce the impact caused by the small color gradient changes between xiaomila and background and the unclear feature information, an improved PAE-YOLO model is proposed, which combines the EMA attention mechanism and DCNv3 deformable convolution is integrated into the YOLOv8 model, which improves the model ' s feature extraction capability and小米在复杂环境中的推理速度,并实现了轻巧的模型。首先,EMA注意机制与Yolov8网络中的C2F模块结合使用。C2F模块可以很好地从输入图像中提取本地特征,而EMA注意机制可以控制全局关系。两者相互补充,从而增强了模型的表达能力;同时,在骨干网络和头网络中,引入了DCNV3卷积模块,该模块可以根据输入特征映射自适应地调整采样位置,从而有助于针对不同尺度和轻量级网络的目标目标更强的功能捕获功能。它还使用深度摄像头来估计小米的姿势,同时分析和优化不同的遮挡情况。通过消融实验,模型比较实验和态度估计实验验证了所提出的方法的有效性。
摘要:本文介绍了一种结合硬件和软件的定制系统,该系统可感知表演者身体因肌肉收缩而产生的生理信号,并将其转换为计算机合成的声音。我们的目标是在该领域研究历史的基础上开发一个完整的集成系统,供非专业音乐家使用。我们描述了 Embodied AudioVisual 交互肌电图,这是一个端到端系统,涵盖音乐家身体上的可穿戴传感、基于定制微控制器的生物信号采集硬件、基于机器学习的手势到声音映射中间件和基于软件的粒度合成声音输出。一种新颖的硬件设计以最少的模拟预处理将来自肌肉的肌电图信号数字化,并在音频信号处理链中将其作为类兼容的音频和无线 MIDI 接口处理。映射层在强化学习配置中实现了交互式机器学习工作流程,并可以将手势特征映射到多维信息空间中的听觉元数据。该系统调整了现有的机器学习和合成模块,使其与硬件配合使用,形成了一个集成的端到端系统。我们通过一系列公开演讲和一系列音乐从业者的音乐会表演探索了其作为数字乐器的潜力。
我们提出了一种实时生成音乐的方法,该方法由从脑电图 (EEG) 估计的用户情感状态驱动。这项工作旨在探索使用传感器数据的实时音乐生成应用策略。应用范围从用于 x-reality 的响应音乐到艺术装置,以及在教学环境中作为反馈的音乐生成。我们在开源平台 OpenViBE 中开发了一个脑机接口。它管理与 EEG 设备的通信并计算相关特征。基准数据集用于评估监督学习方法在价态和唤醒的二元分类任务上的表现。我们还使用减少数量的电极和频带评估了性能,以解决预算较低和环境嘈杂的问题。然后,我们解决了实时音乐生成模型的要求,并提出了对 Magenta 的 MusicVAE 的修改,引入了一个用于控制批次间内存的参数。最后,我们讨论了将所需音乐特征映射到模型的原生输入特征的可能策略。我们提出了一个概率图形模型来模拟从效价/唤醒到 MusicVAE 潜在变量的映射。我们还解决了数据集维度问题,提出了三个概率解决方案。
摘要:本文介绍了一种结合硬件和软件的定制系统,该系统可感知表演者身体因肌肉收缩而产生的生理信号,并将其转换为计算机合成的声音。我们的目标是在该领域研究历史的基础上开发一个完整的集成系统,供非专业音乐家使用。我们描述了 Embodied AudioVisual 交互肌电图,这是一个端到端系统,涵盖音乐家身体上的可穿戴传感、基于定制微控制器的生物信号采集硬件、基于机器学习的手势到声音映射中间件和基于软件的粒度合成声音输出。一种新颖的硬件设计以最少的模拟预处理将来自肌肉的肌电图信号数字化,并在音频信号处理链中将其作为类兼容的音频和无线 MIDI 接口处理。映射层在强化学习配置中实现了交互式机器学习工作流程,并可以将手势特征映射到多维信息空间中的听觉元数据。该系统调整了现有的机器学习和合成模块,使其与硬件配合使用,形成了一个集成的端到端系统。我们通过一系列公开演讲和一系列音乐从业者的音乐会表演探索了其作为数字乐器的潜力。
单元 – 第一线性模型多层感知器 – 向前 – 向后:反向传播误差 – 实践中的多层感知器 – 使用 MLP 的示例 – 概述 – 推导反向传播 – 径向基函数和样条 – 概念 – RBF 网络 – 维数灾难 – 插值和基函数 – 支持向量机单元 – 第三树和概率模型用树学习 – 决策树 – 构建决策树 – 分类和回归树 – 集成学习 – 提升 – 装袋 – 组合分类器的不同方法 – 概率和学习 – 数据转化为概率 – 基本统计 – 高斯混合模型 – 最近邻方法 – 无监督学习 – K 均值算法 – 矢量量化 – 自组织特征映射。单元 – IV 降维和进化模型 降维 – 线性判别分析 – 主成分分析 – 因子分析 – 独立成分分析 – 局部线性嵌入 – Isomap – 最小二乘优化 – 进化学习 – 遗传算法 – 遗传后代:- 遗传算子 – 使用遗传算法 – 强化学习 – 概述 – 迷路示例 – 马尔可夫决策过程 单元 – V 图形模型 马尔可夫链蒙特卡罗方法 – 抽样 – 提案分布 – 马尔可夫链蒙特卡罗 – 图形模型 – 贝叶斯网络 – 马尔可夫随机场 – 隐马尔可夫模型 – 跟踪方法。
为了使对阿尔茨海默氏病(AD)的适当诊断和理解,深度学习已成为检测磁共振成像(MRI)中物理大脑变化的另一种方法。生物医学成像中深度学习的进步,尤其是在MRI扫描中,已被证明是异常检测的有效资源,同时利用卷积神经网络(CNN)在多层perceptron中执行特征映射。在这项研究中,我们旨在测试使用三维卷积神经网络在整个大脑扫描中鉴定与AD患者和对照组之间有区别的神经生理变性的可行性。特别是,我们建议并培训3D-CNN模型,以对认知健康的个体和AD患者进行MRI扫描进行分类。我们在由超过700次MRI扫描(一半AD)组成的大型数据集上验证了我们提出的模型。我们的结果显示验证精度为79%,与当前的最新技术相当。我们提出的3D网络的好处是,它可以通过映射大脑的复杂异质性,尤其是在边缘系统和颞叶中的复杂异质性来帮助探索和检测AD。这项研究的目的是衡量3D卷积网络在HC和AD患者MRI脑扫描中检测神经变性的进展方面的功效和可预测性。
摘要。全脑分割是将整个脑体积划分为解剖标记的感兴趣区域 (ROI),是脑图像分析中的关键步骤。传统方法通常依赖于复杂的管道,这些管道虽然准确,但由于其复杂性而耗时且需要专业知识。或者,端到端深度学习方法提供快速的全脑分割,但通常会由于忽略几何特征而牺牲准确性。在本文中,我们提出了一种新颖的框架,将以前由复杂的基于表面的管道使用但被基于体积的方法忽略的关键曲率特征集成到深度神经网络中,从而实现高精度和高效率。具体而言,我们首先训练一个粗略的解剖分割模型,重点关注高对比度组织类型,即白质 (WM)、灰质 (GM) 和皮层下区域。接下来,我们使用 WM/GM 接口重建皮质表面,并计算表面上每个顶点的曲率特征。然后将这些曲率特征映射回图像空间,在那里它们与强度特征相结合以训练更精细的皮质分割模型。我们还简化了皮质表面重建和曲率计算的过程,从而提高了框架的整体效率。此外,我们的框架非常灵活,可以将任何神经网络作为其主干。它可以作为即插即用组件来增强任何分割网络的全脑分割结果。在公共 Mindboggle-101 数据集上的实验结果表明,与各种深度学习方法相比,分割性能有所提高,速度相当。
摘要。目的。发作间期癫痫样放电 (IED) 发生在两次癫痫发作之间。IED 主要通过颅内记录捕获,通常在头皮上不可见。本研究提出了一种基于张量分解的模型,将头皮脑电图 (sEEG) 的时频 (TF) 特征映射到颅内脑电图 (iEEG) 的 TF 特征,以便以高灵敏度检测头皮上的 IED。方法。采用连续小波变换提取 TF 特征。将来自 iEEG 记录的 IED 段的时间、频率和通道模式连接成四向张量。采用 Tucker 和 CANDECOMP/PARAFAC 分解技术将张量分解为时间、频谱、空间和节段因子。最后,将来自头皮记录的 IED 和非 IED 段的 TF 特征投影到时间分量上进行分类。主要结果。模型性能通过两种不同的方法获得:受试者内和受试者间分类方法。我们提出的方法与其他四种方法进行了比较,即基于张量的空间分量分析方法、基于 TF 的方法、线性回归映射模型以及非对称对称自动编码器映射模型,然后是卷积神经网络。我们提出的方法在受试者内和受试者间分类方法中均优于所有这些方法,分别实现了 84.2% 和 72.6% 的准确率。意义。研究结果表明,将 sEEG 映射到 iEEG 可提高基于头皮的 IED 检测模型的性能。此外,基于张量的映射模型优于基于自动编码器和回归的映射模型。
摘要 — 由于脑电图 (EEG) 的受试者间/受试者内变异性,脑机接口 (BCI) 在实践中难以使用。通常,BCI 系统需要一种校准技术来获取受试者/会话特定数据,以便在每次使用系统时调整模型。这个问题被认为是 BCI 的一个主要障碍,最近出现了一种基于领域泛化的新策略来解决它。鉴于此,我们专注于开发一个 EEG 分类框架,该框架可以直接应用于来自未知域(即受试者)的数据,仅使用先前从不同受试者获得的数据。为此,在本文中,我们提出了一个框架,该框架采用开放集识别技术作为辅助任务,从源数据集中学习特定于主题的风格特征,同时帮助共享特征提取器将看不见的目标数据集的特征映射为新的看不见的域。我们的目标是在同一域中施加跨实例样式不变性,并降低潜在未见主体的开放空间风险,以提高共享特征提取器的泛化能力。我们的实验表明,使用域信息作为辅助网络可以提高泛化性能。临床相关性——本研究提出了一种提高独立于主体的 BCI 系统性能的策略。我们的框架可以帮助减少进一步校准的需要,并可用于一系列心理状态监测任务(例如神经反馈、癫痫发作的识别和睡眠障碍)。
摘要:脑肿瘤是细胞发育不正常的结果。它是全球成年人死亡的主要原因。早期发现脑肿瘤可以避免许多死亡。用于早期脑肿瘤诊断的磁共振成像(MRI)可以提高患者的生存机会。诊断脑肿瘤的最常用方法是 MRI。MRI 中恶性肿瘤的可见性提高使治疗更容易。脑癌的诊断和治疗取决于其识别和治疗。过去十年中提出了许多深度学习模型,包括 Alexnet、VGG、Inception、ResNet、DenseNet 等。所有这些模型都是在庞大的数据集 ImageNet 上训练的。这些通用模型具有许多参数,在针对特定问题实施这些模型时,这些参数变得无关紧要。本研究使用自定义深度学习模型对脑部 MRI 进行分类。提出的疾病和空间注意力模型(DaSAM)有两个模块; (a) 疾病注意模块 (DAM),用于区分图像的疾病区域和非疾病区域;(b) 空间注意模块 (SAM),用于提取重要特征。所提出的模型的实验在两个公开的多类数据集 Figshare 和 Kaggle 数据集上进行,分别达到了 99% 和 96% 的准确率。所提出的模型还使用跨数据集验证进行了测试,在 Figshare 数据集上训练并在 Kaggle 数据集上验证时达到了 85% 的准确率。DAM 和 SAM 模块的结合实现了特征映射功能,这对于在模型的决策过程中突出显示重要特征非常有用。