摘要 — 环境辅助生活 (AAL) 旨在创建创新的技术解决方案和服务,以支持老年人的独立生活,改善他们的生活质量并降低与医疗和社会护理相关的成本。AAL 系统通过基于传感器的技术提供健康监测,以保持健康和功能能力并为老龄化人口提供社会支持。人类活动识别 (HAR) 是开发强大的 AAL 解决方案的推动因素,尤其是在安全关键环境中。因此,在此领域内应用的 HAR 模型(例如用于跌倒检测或向护理人员提供背景信息)需要准确,以协助开发可靠的支持系统。在本文中,我们评估了三种机器学习算法,即支持向量机 (SVM)、隐马尔可夫模型 (HMM) 和 SVM 的混合 (SVM-HMM) 以及应用于老年人和他们的护理人员之间收集的数据集的人工神经网络 (ANN)。检测到的活动稍后将作为双向活动意识系统的输入,以增加社会联系。结果显示这三种算法都具有很高的分类性能。具体来说,SVM-HMM 混合表现出最佳的分类性能。除此之外,我们还将我们的数据集公开供机器学习社区使用。
Omkar Mandave 1; Abhishek Phad 2; Sameer Patekar 3; Nandkishor Karlekar博士4圣雄甘地任务工程技术学院,马哈拉施特拉邦纳维孟买摘要: - 工作信息和分类是计算机科学中最重要的问题之一。识别和识别人类执行的动作或任务是智能视频系统的主要目标。人类活动用于许多应用,从人机相互作用到监视,安全和医疗保健。尽管不断努力,但在无限领域的工作知识仍然是一项艰巨的任务,并且面临许多挑战。在本文中,我们关注有关各种认知功能的一些当前研究文章。该项目包括三种流行的定义项目的方法:基于视觉的(使用估算),实用设备和智能手机。我们还将讨论上述方法的一些优点和缺点,并简要比较其准确性。结果还将显示可视化方法如何成为当今HAR研究的流行方法。关键字: - 人工智能(AI),人类活动识别(HAR),计算机视觉,机器学习。
摘要。人类活动识别 (HAR) 正在成为现代的一个重要问题,并直接影响移动健康领域。因此,设计能够正确识别个人活动的系统至关重要。在这项工作中,我们开发了一个使用物联网 (ΙοΤ) 和机器学习技术的系统,以监控和协助个人的日常生活。我们将使用移动应用程序和内置传感器(加速度计和陀螺仪)的可穿戴设备收集的数据与公开数据集的数据进行了比较。通过这种方式,我们能够验证我们的结果,并研究我们为人类活动识别问题选择的可穿戴设备的功能和适用性。使用我们的数据集呈现的不同类型活动的分类结果 (99%) 优于来自公开数据库的结果 (97%)。
人类活动识别(HAR)在使用配备传感器的设备和大型数据集的日益增长的情况下变得非常重要。本文使用HAR的五个关键基准数据集(UCI-HAR,UCI-HAR,PAMAP2,WISDM,WISDM和Berkeley Mhad)评估了三类模型的性能:经典的机器学习,深度学习体系结构和受限制的Boltzmann机器(RBMS)。我们使用诸如准确性,精度,回忆和F1评分等群集以进行全面比较,评估了各种模型,包括决策树,随机森林,卷积神经网络(CNN)和深信仰网络(DBN)。结果表明,CNN模型在所有数据集中都提供了卓越的表现,尤其是在伯克利MHAD上。像随机森林这样的经典模型在较小的数据集上做得很好,但是面对具有较大,更复杂数据的Challenges。基于RBM的模型还显示出显着的潜力,尤其是对于特征学习。本文提供了详细的比较,以帮助研究人员选择最合适的HAR任务模型。
本文介绍了几种方法:一种基于居民分离的方法,称为SEQ2RES,另一种基于多标签分类,称为BigRu+Q2L。第三种方法将它们结合到两个阶段的模型中。与以前的分离不同,将传感器事件分配给居民一一将传感器事件分配给居民,SEQ2RES采用序列到序列(SEQ2SEQ)[18] ARCHITCOUNT。它对整个传感器序列进行建模,并基于建模上下文生成分离的序列。另一方面,Bigru+Q2L使用注意机制不仅在活动标签之间,而且在标签和特征之间进行构成相关性。这可以实现更准确,更灵活的多标签分类。最后,这两种方法是在一个模型中组合在一起的,该模型将居民信息分开,同时考虑居民活动的相关性。
随着发达国家的老年人比例在全球范围内持续上升,以满足其医疗保健需求,尤其是在维护自身方面,这是至关重要的。越来越多的研究集中在环境辅助生活(AAL)系统上,旨在减轻与老年人独立生活有关的担忧。本系统的审查研究了老年人的跌倒检测和人类活动识别(HAR)的文献,这是确保他们独自生活时确保其安全的两项关键任务。特定于此,本综述强调了对计算机视觉数据的深度学习方法(DL)方法,反映了该领域的当前趋势。全面搜索从2019年至2023年(包括)的五个不同来源产生了2,616件作品。从这个池中,选择了151件相关作品进行详细分析。评论仔细检查了使用的DL模型,数据集和硬件配置,特别强调了诸如隐私
摘要:脑电图 (EEG) 是一种非侵入性方法,通过监测认知和运动任务期间的神经反应来辨别人类行为。机器学习 (ML) 是一种很有前途的人类活动识别 (HAR) 工具,可解释人工智能 (XAI) 可以阐明 EEG 特征在基于 ML 的 HAR 模型中的作用。本研究的主要目的是调查基于 EEG 的 ML 模型对日常活动(例如休息、运动和认知任务)进行分类的可行性,并通过 XAI 技术对模型进行临床解释,以阐明对不同 HAR 状态贡献最大的 EEG 特征。该研究涉及对 75 名健康个体的检查,这些个体之前没有神经系统疾病的诊断。在静息状态、两种运动控制状态(行走和工作任务)和认知状态(阅读任务)期间获得了 EEG 记录。电极被放置在大脑的特定区域,包括额叶、中央叶、颞叶和枕叶(Fz、C1、C2、T7、T8、Oz)。使用 EEG 数据训练了几种 ML 模型以进行活动识别,并采用 LIME(局部可解释模型不可知解释)对 HAR 模型中最具影响力的 EEG 频谱特征进行临床解释。HAR 模型的分类结果,尤其是随机森林和梯度提升模型,在区分所分析的人类活动方面表现出色。ML 模型在人类活动识别方面表现出与 EEG 频谱带的一致性,这一发现得到了 XAI 解释的支持。总之,将可解释人工智能(XAI)纳入人类活动识别(HAR)研究可能会改善患者康复、运动意象、医疗保健元宇宙和临床虚拟现实设置的活动监测。
学习多个参与者之间的时空关系对于群体活动识别至关重要。不同的群体活动通常会展示视频中参与者之间的多样化互动。因此,从时空参与者演化的单一视角来建模复杂的群体活动往往很困难。为了解决这个问题,我们提出了一个独特的双路径参与者交互 (Dual-AI) 框架,它以两种互补的顺序灵活地排列空间和时间变换器,通过整合不同时空路径的优点来增强参与者关系。此外,我们在 Dual-AI 的两个交互路径之间引入了一种新颖的多尺度参与者对比损失 (MAC-Loss)。通过帧和视频级别的自监督参与者一致性,MAC-Loss 可以有效区分单个参与者表示,以减少不同参与者之间的动作混淆。因此,我们的 Dual-AI 可以通过融合不同参与者的这些判别特征来增强群体活动识别。为了评估所提出的方法,我们在广泛使用的基准上进行了大量实验,包括排球 [ 21 ]、集体活动 [ 11 ] 和 NBA 数据集 [ 49 ]。所提出的 Dual-AI 在所有这些数据集上都实现了最佳性能。值得注意的是,所提出的 Dual-AI 使用 50% 的训练数据,其性能优于许多近期使用 100% 训练数据的方法。这证实了 Dual-AI 在群体活动识别方面的泛化能力,即使在有限监督的具有挑战性的场景下也是如此。
可解释的机器学习和人工智能模型已用于证明模型的决策过程。这种增加的透明度旨在帮助提高用户的表现和对底层模型的理解。然而,在实践中,可解释的系统面临许多悬而未决的问题和挑战。具体来说,设计人员可能会降低深度学习模型的复杂性以提供可解释性。然而,这些简化模型生成的解释可能无法准确地证明模型的合理性,也无法真实地反映模型。这可能会进一步增加用户的困惑,因为他们可能认为这些解释对于模型预测没有意义。了解这些解释如何影响用户行为是一个持续的挑战。在本文中,我们探讨了解释的真实性如何影响智能系统中的用户表现和一致性。通过对可解释活动识别系统的受控用户研究,我们比较了视频评论和查询任务的解释真实性变化。结果表明,与准确解释和没有解释的系统相比,低真实性的解释会显著降低用户的表现和一致性。这些发现证明了准确和易懂的解释的重要性,并警告说,就对用户表现和对人工智能系统的依赖的影响而言,糟糕的解释有时比没有解释更糟糕。
防守球员(演员 4)快速移动以击球和阻挡球,而其他球员(例如演员 2 和演员 3)则站着不动。因此,最好先对时间动态进行建模。