。CC-BY-ND 4.0 国际许可证(未经同行评审认证)是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是由此预印本的版权持有者于 2025 年 1 月 2 日发布的。 ;https://doi.org/10.1101/2025.01.02.631092 doi:bioRxiv 预印本
摘要 事件相关电位(ERP)反映了大脑对外部事件作出反应的神经生理变化,其背后的复杂时空特征信息受大脑内持续的振荡活动支配。深度学习方法以其出色的特征表示能力越来越多地被用于基于ERP的脑机接口(BCI),可以深入分析大脑内的振荡活动。时空频率较高的特征通常表示详细和局部的信息,而时空频率较低的特征通常表示全局结构。从多个时空频率中挖掘脑电特征有利于获得更多的判别性信息。本文提出了一种多尺度特征融合八度卷积神经网络(MOCNN)。MOCNN将ERP信号分为对应于不同分辨率的高频、中频和低频分量,并在不同的分支中进行处理。通过添加中频和低频分量,可以丰富MOCNN使用的特征信息,并减少所需的计算量。 MOCNN 在使用时间和空间卷积进行连续特征映射后,通过分支间特征信息交换实现不同组件间的交互式学习。将融合的深度时空特征从各个组件输入到全连接层,实现分类。在两个公共数据集和一个自采集的 ERP 数据集上获得的结果表明,MOCNN 可以实现最佳的 ERP 分类性能。本研究将广义的八度卷积概念引入到 ERP-BCI 研究领域,通过分支宽度优化和各个尺度上的信息交互,可以从多尺度网络中提取有效的时空特征。索引词——脑机接口、事件相关电位、深度学习、多尺度、八度卷积神经网络。
航空航天燃气涡轮发动机 (GTE) 是复杂的机器,必须对其进行监控和维护,以确保长期可靠运行 [1]。最大限度提高可靠性的一个关键概念是基于条件而不是基于计划的维护 [2]。这需要对发动机状况进行准确评估,但这可能很难获得。发动机状况通常相对于机队中的类似资产以及功能性能阈值进行评估,并且需要维护决策者具备专业的工程知识。传统上,评估发动机性能的有限人力资源由小型数据快照和故障模式特定功能工程支持。较大的数据包是临时从在役状态收集的,但这在后勤上成本高昂,并且通常仅限于观察到运行中断的情况。需要新的方法来支持更高效的在役操作。从发动机上放置的各种不同传感器获得的数据是评估发动机状况的主要资源。然而,由于传感器数量众多、飞行中带宽限制和机载存储限制,大多数当前系统无法将所有数据返回地面进行分析 [3]。因此,有必要
©作者2025。Open Access本文在创意共享属性下获得许可 - 非商业 - 非洲毒素4.0国际许可证,该许可允许以任何中等或格式的任何非商业用途,共享,分发和复制,只要您与原始作者提供适当的信誉,并为您提供了符合创造性共识许可的链接,并提供了持有货物的启动材料。您没有根据本许可证的许可来共享本文或部分内容的适用材料。本文中的图像或其他第三方材料包含在文章的创意共享许可中,除非在信用额度中另有说明。如果本文的创意共享许可中未包含材料,并且您的预期用途不受法定法规的允许或超过允许的用途,则您需要直接从版权所有者那里获得许可。要查看此许可证的副本,请访问h t p://c r e a t i v e c o m m o ns。or g/l i c e n s e s/b y-n c-n c-n c-n d/4。0/。
大脑是人体最复杂的器官之一,拥有大量细胞。当细胞分裂不受控制并形成不规则肿块时,脑肿瘤就会增加。这组细胞会影响大脑的正常功能和活动模式,并损害健康的脑细胞 [1]。X 射线图像通常用于评估和识别人体的肿瘤生长。使用医学检查成像技术(如磁共振成像 (MRI) 和计算机断层扫描 (CT) [2])也可以检测出脑肿瘤。数字图像处理是分析 MRI 扫描的关键任务。肿瘤发生在颅骨内。肿瘤会导致极高的脑压,并扩散到整个脑区。其中一些肿瘤可能是恶性的,并导致癌症,癌症是主要的死亡原因,占全球所有死亡人数的 13% 左右。如今,放射科医生通过目视检查来识别脑肿瘤。肿瘤分类过程可能非常耗时,其准确性取决于放射科医生的技能和经验。随着接受 MRI 扫描的患者数量的增加,每天需要分析的数据量非常大,这使得基于视觉解释的读取既昂贵又缓慢。将脑肿瘤分类为各种病理类型比二元分类更具挑战性。相关挑战归因于多种因素,例如同一肿瘤类型在形状、大小和强度方面存在很大差异 [3],而不同病理类型的表现相似 [4]。脑肿瘤的假阴性诊断可能导致患者生存机会降低。假阳性
通讯作者:星期日。导航日常生活成为一项艰巨的任务,挑战与寻找放错位置的个人物品并意识到其环境中的对象以避免碰撞。这需要需要自动解决方案来促进对象识别。虽然传统的方法,例如导犬,白色的甘蔗和盲文提供了有价值的解决方案,但最近的技术解决方案,包括基于智能手机的识别系统和便携式相机,但遇到了诸如与文化特异性,设备特异性和缺乏系统自治有关的限制。这项研究通过引入卷积神经网络(CNN)对象识别系统的限制解决了解决方案,该解决方案旨在集成到一个移动机器人中,该机器人旨在作为视觉障碍者的机器人助手。机器人助手能够在狭窄的环境中四处走动。它将覆盆子PI与一个编程的摄像头结合在一起,以识别三个对象:手机,鼠标和椅子。一个卷积神经网络模型进行了训练以供对象识别,其中30%用于测试。使用Google Colab中的Yolov3模型进行了培训。对识别系统的定性评估的精度为79%,召回96%,机器人助手的精度为80%。它还包括一个图形用户界面,用户可以轻松地控制机器人助手的运动和速度。发达的机器人助手显着增强了自主权和对象识别,有望在视力受损的个体的日常导航中获得可观的好处。
a 秘鲁利马工程技术大学 - UTEC b 巴西圣保罗坎皮纳斯大学 c 英国科尔切斯特埃塞克斯大学 d 中国江苏南通大学
现实世界的视觉数据具有固有的层次结构,可以在双曲线空间中有效地代表。双曲神经网络(HNN)是在此类空间中学习特征表示的有前途的方法。然而,计算机视觉中的当前HNN依赖于欧几里得主链,并且仅在任务头中的双曲线空间唯一的项目功能,从而限制了它们充分利用双曲线几何的好处的能力。为了解决这个问题,我们提出了HCNN,这是一种全均匀的卷积神经网络(CNN),专为计算机视觉任务而设计。基于Lorentz模型,我们概括了CNN的基本组合,并提出了卷积层,批准归一化和多项式逻辑回归的新型公式。对标准视频任务的实验证明了在混合和完全双曲的设置中我们的HCNN框架的有希望的性能。总体而言,我们认为我们的贡献为开发更强大的HNN提供了基础,这些HNN可以更好地代表图像数据中发现的复杂结构。我们的代码可在https://github.com/kschwethelm/hyperboliccv上公开获取。
人脑可以从少数样本中有效地学习一项新任务,这表明大脑可以将其先验知识转移到不同操作中的任务。此功能类似于机器学习领域中的转移学习(TL)。tl在特定的任务域中使用训练有素的纤维空间,以通过不足的培训数据来提高新任务的性能。tl具有丰富的图表,例如卷积神经网络(CNN)的特征,在不同的任务域中显示出较高的概括能力。但是,这种TL仍然无法使机器学习获得与人脑相关的概括能力。检查是否可以使用大脑的间表示来实现更有效的TL,我们引入了一种由Human Brains介导的TL方法。我们的方法通过使用测量的大脑反应来向前学到的社会,将CNN中视听输入的特征表示为单个大脑的激活模式。然后,为了估计标签反映了视听输入引起的人类认知和行为,转化的表示形式用于TL。我们证明,我们的脑介导的TL(BTL)在标签估计中显示出比标准TL更高的性能。此外,我们说明,大脑介导的估计因大脑之间而异,并且可变性反映了感知的个体变异性。因此,我们的BTL为提高机器学习特征表示的概括能力并使机器学习能够估算人类样的认知和行为,包括个体可变性。
摘要 - 基于EEG的大脑计算机界面(BCI)允许人们使用大脑信号进行交流和控制外部设备。通过从EEG信号中检测用户意图,BCI的应用范围从协助不稳定到在虚拟现实环境中的交互。主要问题在于正确地对EEG信号进行分类以发出命令,并以最少的预处理和资源要求。为了克服这些问题,我们提出了一种新型的优化连接神经网络模型BCInet。我们已经评估了在移动大脑/身体成像(MOBI)设置中收集的两个基于EEG的BCI数据集上的BCINET。BCInet显着优于两个数据集的分类,其准确性提高了20%,而少于75%的可训练参数。这样的模型具有提高的性能,而对计算资源的要求较少为开发具有高性能的几种现实世界中的BCI应用程序开辟了可能性。索引术语 - 跨学神经网络,深度学习,脑电图,脑部计算机界面,MOBI,认知冲突,BCINET。