摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周的 12 种手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
自然,人类使用多种模式来传达信息。在人类大脑中,这些模式既按顺序处理,又并行处理,以进行交流,当人类与计算机交互时,这种情况会发生变化。使计算机能够以多模式处理输入是人机交互 (HCI) 的主要研究领域。技术的进步(强大的移动设备、先进的传感器、新的输出方式等)为研究人员设计允许多模式交互的系统开辟了新的途径。多模式输入取代传统的交互方式只是时间问题。本文介绍了多模式系统领域,解释了其简要历史,描述了多模式系统相对于单模式系统的优势,并讨论了各种模式。讨论了输入建模、融合和数据收集。最后,列出了多模式系统研究中的挑战。文献分析表明,与单模式系统相比,多模式界面系统提高了任务完成率并减少了错误。多模式交互的常用输入是语音和手势。对于多模态输入,研究人员更喜欢输入模态的后期整合,因为它可以轻松更新模态和相应的词汇。
摘要:基于手势的交互是一种自然的人机交互方式,在普适计算环境中有着广泛的应用。本文提出了一种基于加速度的手势识别方法,称为 FDSVM(基于帧的描述符和多类 SVM),该方法仅需要可穿戴的三维加速度计。使用 FDSVM,首先收集手势的加速度数据并用基于帧的描述符表示,以提取判别信息。然后构建基于 SVM 的多类手势分类器以在非线性手势特征空间中进行识别。在包含数周内 12 个手势的 3360 个手势样本的数据集上进行的大量实验结果表明,所提出的 FDSVM 方法明显优于其他四种方法:朴素贝叶斯、DTW、HMM 和 C4.5。在用户相关的情况下,FDSVM 对 4 个方向手势的识别率为 99.38%,对所有 12 个手势的识别率为 95.21%。在用户无关的情况下,它对 4 个手势的识别率为 98.93%,对 12 个手势的识别率为 89.29%。与文献中报道的其他基于加速度计的手势识别方法相比,FDSVM 在用户相关和用户无关的情况下均能给出最佳结果。
软致动器 (SA) 是一种可以与精密物体进行交互的设备,而传统机器人无法实现这种交互方式。虽然可以设计一种通过外部刺激触发驱动的 SA,但使用单一刺激会对驱动的空间和时间控制带来挑战。本文介绍了一种 4D 打印多材料软致动器设计 (MMSA),其驱动仅由触发器组合(即 pH 和温度)启动。使用 3D 打印,设计了一种多层软致动器,该致动器具有亲水性 pH 敏感层和疏水性磁性和温度响应形状记忆聚合物层。水凝胶通过膨胀或收缩来响应环境 pH 条件,而形状记忆聚合物可以抵抗水凝胶的形状变形,直到被温度或光触发。这些刺激响应层的组合允许对驱动进行高水平的时空控制。通过一系列货物捕获和释放实验,证明了 4D MMSA 的实用性,验证了其展示主动时空控制的能力。MMSA 概念为开发多功能软设备提供了一个有前途的研究方向,这些设备在生物医学工程和环境工程中具有潜在的应用前景。
生成式人工智能现已应用于从教育到工业的各个领域。将其集成到您的工作流程中可以提高生产力。在本次研讨会上,我们将探索一些可以集成生成式人工智能的 MathWorks 工具。深度学习正在迅速融入日常应用中,学生和教育工作者很快将必须采用这项技术来解决复杂的现实问题。MATLAB 和 Simulink 提供了一个灵活而强大的平台来开发和自动化人工智能、深度学习、数据分析和模拟工作流程。在本次研讨会上,我们将通过利用之前训练过的网络并使用 MATLAB Deep Network Designer 对其进行修改来介绍使用 MATLAB 进行深度学习。Deep Network Designer 允许您以交互方式构建、可视化和训练神经网络。个人将能够生成神经网络代码并微调参数。用户可以使用流行的预训练网络或构建自己的网络。我们还将研究 MATLAB 分类学习器在单个数据集上运行多个模型。这些可视化方法允许用户创建更高效的工作流程。Jon Loftin,主持人
摘要 随着越来越多的设备和系统融入到我们网络世界的结构中,集成的规模和复杂性正在快速增长。我们现有的系统软件设计方法和培训,以面向对象设计原则为基础,对小规模系统非常有效,但随着我们发现操作限制,需要逐年频繁且无意地重新设计程序,这些方法和培训开始失效。从根本上讲,面向对象的思维使我们以紧密耦合的交互方式思考,其中包括强状态假设。大型分布式系统通常是由独立方创建的子系统的混合体,这些子系统通常使用不同的中间件技术,接口不一致。使用面向对象的思维集成此类子系统带来了一些根本挑战:(1)它对于增量和独立开发来说很脆弱,因为接口可能会在不经通知的情况下发生变化;(2)子系统之间在双方必须交换的信息的数量和质量方面通常存在“阻抗不匹配”; (3) 确实需要实时动态适应网络拓扑重新配置和故障;(4) 在这种动态环境中,可扩展性、性能和正常运行时间不能总是受到损害。需要一种不同的范式来系统地应对这些新挑战。随着集成规模和复杂性的增长,唯一的统一共同点是
语音是我们最自然、最有效的交流方式,具有改善人机交互方式的巨大潜力。然而,语音通信有时会受到环境(例如环境噪音)、上下文(例如公共场所的隐私需求)或健康状况(例如喉切除术)的限制,从而阻碍可听语音的考虑。在这方面,已经提出了静音语音接口 (SSI)(例如,考虑视频、肌电图),然而,许多技术在日常使用中仍然面临限制,例如需要将设备与扬声器接触(例如,电极/超声波探头),并引发技术(例如,视频的照明条件)或隐私问题。在这种情况下,考虑可以帮助解决这些问题的技术,例如通过非接触式和/或放置在环境中,可以促进 SSI 的广泛使用。在本文中,我们将探讨连续波雷达以评估其在 SSI 方面的潜力。为此,我们获取了 3 位说话者的 13 个单词的语料库,并对结果数据测试了不同的分类器。使用 Bagging 分类器获得的最佳结果是,针对每位说话者进行训练,并进行 5 倍交叉验证,平均准确率为 0.826,这是一个令人鼓舞的结果,为进一步探索这项无声语音识别技术奠定了良好的基础。索引词:连续波雷达、无声语音识别、欧洲葡萄牙语、机器学习
南卡罗来纳大学 Jenay M. Beer 工程与计算学院和社会工作学院 佐治亚理工学院 Arthur D. Fisk 心理学院和 Wendy A. Rogers 心理学院 自主性是与人机交互 (HRI) 相关的一个关键概念,在不同的机器人平台上存在很大差异。从远程操作到完全自主系统,机器人自主性 (LORA) 的水平影响着人类与机器人之间的交互方式。因此,需要通过识别影响机器人自主性的变量(以及受机器人自主性影响的变量)来理解 HRI。我们的总体目标是为 HRI 中的 LORA 开发一个框架。为了实现这一目标,我们的框架将 HRI 与人机交互联系起来,人机交互是一个研究和理解与人类相关的变量的悠久历史的领域。在 HRI 的背景下,对自主性的构造进行了审查和重新定义。此外,该框架提出了一种通过按照 10 点分类法对自主性进行分类来确定机器人自主性水平的过程。该框架旨在作为确定自主性的指南,按照定性分类法对 LORA 进行分类,并考虑可能受 LORA 影响的 HRI 变量(例如接受度、情况意识、可靠性)。关键词:人机交互、自动化、自主性、机器人自主性水平、框架
图 2. 视觉表征从感觉皮质传播到联想皮质。A. 编码分析得出的相关分数,经过训练可根据刺激角度的正弦和余弦预测脑电图活动。B. 每个点对应于使用最小范数估计从脑电图编码拓扑估计的源。x 轴对应于沿后前方向的源位置。y 轴表示每个源中峰值活动的相对时间(顶部面板)或此峰值的强度(底部面板)。星号表示统计显著性(**:p<.01,***:p < 0.001)C. 与 B 相同的数据,但绘制在皮质表面。颜色表示峰值幅度(例如黑色:幅度 = 各个源的中值幅度)和峰值潜伏期(例如蓝色:峰值在各个源的最早响应的 5% 百分位数内,红色:峰值超过 95% 百分位数)。D. 增量和脑电图幅度之间的相关系数。 E-F. 类似分析 tp BC 应用于编码连续刺激之间变化的大脑反应(Delta)。G. 使用角度(sin+cos)和 delta 获得的交叉验证编码分数(Pearson R)。颜色表示 EEG 通道。结果可以在 https://kingjr.github.io/chronicles/ 上以交互方式显示
自人工智能 (AI) 和机器学习 (ML) 出现以来,研究人员一直在研究智能计算系统如何与用户及其周围环境交互和联系,从而引发了有关偏见的人工智能系统、ML 黑盒、用户信任、用户对系统的控制感知以及系统透明度等问题的争论。所有这些问题都与人类如何通过使用不同交互模式的界面与人工智能或机器学习系统交互有关。先前的研究从各种角度解决了这些问题,从通过伦理和科学技术研究 (STS) 视角理解和构建问题,到为问题找到有效的技术解决方案。但几乎所有这些努力都有一个共同的假设:如果系统能够解释其预测的方式和原因,人们就会有更好的控制感知,因此会更加信任这样的系统,甚至可以纠正它们的缺点。这个研究领域被称为可解释人工智能 (XAI)。在这个工作室中,我们总结了该领域先前的努力;然而,我们专注于使用有形和具身交互 (TEI) 作为理解 ML 的交互方式。我们注意到,物理形式及其行为的可用性不仅可以为 ML 系统的可解释性做出贡献,还可以为批评创造一个开放的环境。这个工作室旨在批评可解释的 ML 术语,并描绘 TEI 可以为 HCI 提供的机会,以设计更可持续、更易掌握和更公正的智能系统。