人工智能的不断发展对生物医学等领域产生了深远的影响,提供了新的研究思路和技术方法。类脑计算是多模态技术与生物医学领域的重要交叉点。本文聚焦人机交互中脑信号解码文本和语音的应用场景,全面回顾了基于深度学习的类脑计算模型,追踪了其演进、应用价值、挑战和潜在的研究趋势。首先回顾了其基本概念和发展历史,将其演进分为近代机器学习和当代深度学习两个阶段,强调了每个阶段在人机交互类脑计算研究中的重要性。此外,从数据集、不同脑信号等五个角度回顾了深度学习在人机交互类脑计算不同任务中的最新进展,并详细阐述了模型中关键技术的应用。尽管类脑计算模型取得了重大进展,但充分发挥其能力仍面临挑战,并为未来的学术研究提供了可能的方向。欲了解更详细信息,请访问我们的 GitHub 页面:https://github.com/ultracoolHub/brain-inspired-computing。
人机协作是许多领域中一种很有前途的范例,因为它有可能充分利用人类的灵活性和机器人的精确性 (Reason, 2000)。即使有了极其复杂和高度发展的技术,机器人系统也主要由人类操作,干预和控制程度也各不相同 (Power 等, 2015)。然而,需要外科医生远程操纵机械臂的遥控控制可能会带来诸如模糊性和缺乏运动反馈等问题 (Chen 等, 2007),从而导致过度的心理工作负荷 (MWL),进而影响外科医生的表现。由于极端的 MWL 会降低性能并增加错误概率 (Yurko 等, 2010),操作员的工作负荷正成为决定人机协作是否成功的核心问题。因此,人们对开发能够在任务执行期间根据操作员的 MWL 为其提供不同程度协助的机器人的兴趣日益浓厚 (即基于心理工作负荷的自适应自动化) (MWL-AA)。
强化学习 (RL) 在实现机器人自主习得复杂操作技能方面前景广阔,但在现实环境中实现这一潜力却充满挑战。我们提出了一个基于视觉的人机协同强化学习系统,该系统在一系列灵巧操作任务中展现出令人印象深刻的性能,包括动态操作、精密装配和双臂协调。我们的方法融合了演示和人工校正、高效的强化学习算法以及其他系统级设计选择,旨在学习在短短 1 到 2.5 小时的训练时间内即可实现近乎完美的成功率和快速循环时间的策略。我们证明,我们的方法显著优于模仿学习基线和先前的强化学习方法,平均成功率提高了 2 倍,执行速度提高了 1.8 倍。通过大量的实验和分析,我们深入了解了该方法的有效性,展示了它如何为反应式和预测式控制策略学习稳健且自适应的策略。我们的结果表明,强化学习确实能够在实际训练时间内直接在现实世界中学习各种基于视觉的复杂操作策略。我们希望这项工作能够激发新一代学习型机器人操作技术,促进工业应用和研究进步。视频和代码可在我们的项目网站 https://hil-serl.github.io/ 获取。
在本教程中,我们将重点介绍文本到文本生成,这是一类自然语言生成 (NLG) 任务,它将一段文本作为输入,然后根据某些特定标准(例如可读性或语言风格)生成改进的修订版本,同时在很大程度上保留文本的原始含义和长度。这包括许多有用的应用,例如文本简化、释义生成、风格转换等。与文本摘要和开放式文本完成(例如故事)相比,我们在本教程中讨论的文本到文本生成任务在语义一致性和目标语言风格方面受到更多限制。这种控制水平使这些任务成为研究模型生成语义充分且风格适当的文本的能力的理想试验台。此外,从技术角度来看,这些任务很有趣,因为它们需要词汇和句法转换、风格控制和对事实知识的遵守的复杂组合——所有这些都是同时进行的。本教程特别关注文本简化和修订,旨在从数据、模型、人机协作和评估四个主要方面概述最先进的自然语言生成研究,并讨论和展示一些重大的最新进展:(1)使用非倒退方法;(2)从微调到使用大型语言模型提示的转变;(3)开发新的可学习指标和细粒度人工评估框架;(4)非英语语言的研究和数据集不断增加;(5)HCI+NLP+可访问性跨学科研究的兴起,以创建现实世界的写作助手系统。
• 法学硕士 (LLM) 的进步 • 人机系统中的人工智能集成 • 机器人和自动化中的人工智能 • 人机交互的未来趋势和新兴技术 • 增强认知 • 权限/控制转移 • 受大脑启发的自主系统 • 脑机接口 • 决策支持和推荐系统 • 人机共生系统的伦理方面 • 人机交互 • 人机自主合作和团队合作 • 人类绩效建模 • 人机/机器人交互 • 智能自适应系统 • 人机共生系统中的弹性工程 • 团队绩效和培训系统 • 信任建模、测量和管理 • 虚拟和混合现实系统
人类与人工智能 (AI) 系统的交互正在成为我们日常生活的一部分。根据提示生成文本和图像、向网站聊天机器人寻求帮助或要求语音助手播放我们最喜欢的播放列表只是与 AI 系统交互提供的几种可能性。如果设计得当,这些互动有可能增强人类的工作、能力和福祉。在本次研讨会上,我们决定采取特定的观点,即人工智能系统不仅仅是一种表达或交流的工具,而是扮演“传播者”的角色,即人类创造意义的系统 [ 1 ]。这种转变为设计人类和人工智能系统互动的新方式带来了许多新的挑战和机遇。例如,这样的人工智能传播者可能有权发起沟通互动,并应该有效地促进这种互动。
摘要 人与机器人之间的有效交互对于在协作过程中完成共享任务至关重要。机器人可以利用多种通信渠道与人类互动,例如听觉、语音、视觉、触觉和学习。在人与机器人之间的各种交互方式中,我们的重点是三个新兴前沿,它们对人机交互 (HRI) 的未来方向产生重大影响:(i) 受人与人协作启发的人机协作,(ii) 脑机接口,以及 (iii) 情感智能感知。首先,我们探索人机协作的先进技术,涵盖从合规性和基于绩效的方法到协同和基于学习的策略等一系列方法,包括从演示中学习、主动学习和从复杂任务中学习。然后,我们研究脑机接口在增强 HRI 方面的创新用途,重点关注康复、通信、大脑状态和情绪识别中的应用。最后,我们研究机器人中的情商,重点是通过面部表情、肢体动作和眼球追踪将人类情感转化为机器人,实现流畅、自然的互动。详细介绍并讨论了这些新兴领域的最新发展及其对 HRI 的影响。我们重点介绍了该领域的当代趋势和新兴进步。最后,本文强调了在开发具有自适应行为和人机有效互动的系统时采用多模式方法的必要性,从而提供了对最大限度地发挥 HRI 潜力所必需的各种模式的透彻理解。
代理是按照人类的形象设计的,无论是内部还是外部。代理的内部系统模仿人类的大脑,无论是在硬件(即神经形态计算)还是软件(即神经网络)层面。此外,代理的外观和行为是由人设计的,并基于人类数据。有时,代理的这些类似人类的品质是故意选择的,以增加其对人类用户的社会影响力,有时影响代理感知的人为因素是隐藏的。受 Blascovich 的“社会影响阈值”(Blascovich 等人,2002 年)启发,该模型旨在解释虚拟环境中拟人化实体代理的不同方法的影响,我们提出了一个新颖的框架来理解人类对代理的人类品质归因如何影响其在人机交互中的社会影响。社会影响(EIA)的外部和内部归因模型建立在沉浸式虚拟现实中代理化身的先前研究的基础上,并提供了一个将先前的社会科学理论与神经科学联系起来的框架。EIA 将代理的外部和内部归因与两个与社会影响相关的大脑网络联系起来:外部感知系统和心理化系统。关注人机交互研究的每个归因
本文探讨了使用大型语言模型 (LLM) 加速人机交互的问题。它通过考虑 LLM 的难以形式化的认知语义解释,超越了可解释人工智能 (XAI) 的传统逻辑范式。XAI 沉浸在一个混合空间中,在交互过程的数字化过程中,人类和机器具有关键的区别。作者的收敛方法确保了使 XAI 有目的性和可持续性的条件。该方法基于逆问题解决方法、认知建模、遗传算法、神经网络、因果循环动力学和特征形式实现。事实证明,决策者需要为信息处理创建独特的结构条件,使用 LLM 来加速集体问题解决的收敛。这些实施已在情境中心的集体战略规划期间进行。这项研究有助于在经济、科学和技术领域的许多分支中推进可解释的 LLM。
2023 年初,埃隆·马斯克的 Neuralink 宣布,他们将在获得医院机构审查委员会的批准后开始招募参与者。这项批准意味着 Neuralink 可以进行实验性大脑植入,以“让人们能够仅使用自己的思想来控制计算机光标或键盘”(Neuralink,2023 年)。2024 年 1 月,Neuralink 将芯片植入参与者的大脑。随着 Neuralink 的第一位患者取得了非凡的里程碑,进展仍在继续。据报道,这位 29 岁的男子因车祸瘫痪,仅凭自己的思想就能玩电子游戏并在 X 上发帖(路透社,2024 年)。Neuralink 首次人体临床试验的批准引起了媒体的极大关注。在本白皮书中,我们将简要介绍脑机接口 (BCI) 的背景,包括最近的发展、当前和潜在的应用领域,以及它对教育和研究的可能影响。我们将涉及与 BCI 相关的伦理考量,但我们的讨论不会深入探讨这一方面。我们从案头研究和对三位专家的采访中收集了见解: