摘要 - 零击对象导航(ZSON)使代理能够在未知环境中朝着开放式摄制对象导航。ZSON的现有作品主要集中于遵循单个说明,以查找通用对象类,忽略了自然语言互动的利用以及识别特定用户特定对象的复杂性。为了解决这些限制,我们引入了零击交互式个性化对象导航(Zipon),在与用户进行对话时,机器人需要导航到个性化目标对象。要解决Zipon,我们提出了一个新的框架,称为开放世界交互式个性化导航(Orion)1,该框架使用大型语言模型(LLMS)来做出顺序决策,以操纵不同的模块以进行感知,导航和交流。实验结果表明,可以利用用户反馈的交互式剂的性能会显示出显着改善。但是,对于所有方法,在任务完成与导航和互动效率之间获得良好的平衡仍然具有挑战性。我们进一步提供了更多有关不同用户反馈表对代理商绩效的影响的发现。
规划和经济发展经理 Doug Hammel 就 9 月 3 日会议讨论的内容进行了最新介绍。Hammel 先生回顾了之前提出的堆叠停车分区概念,即停车计划需要由业主提交,供社区发展总监批准。他指出了堆叠计划获得批准需要满足的一些门槛。他还指出,在之前的讨论中,委员们询问是否可以将公共通行权中的路边停车位用作堆叠停车计划的一部分。他表示,如果要将这一概念包括在公共通行权中,还需要修改《村庄法》第 6 章和第 7 章中的法规。需要对法典第 6 章进行修订,因为该章节目前禁止为特定用户保留公园大道停车位,并要求通过公众听证程序来授权与公园大道停车位安装相关的通行权修改。在第 7 章中,该法规目前考虑了限制停车区和禁止停车区,但并未考虑可能因属于堆叠停车配置而受到限制的街道区域。在公开发布议程包后,工作人员收到了警察局长的意见。帕罗特局长对拟议的概念表示担忧,因为它将依赖公共通行权中的预留停车位,并指出允许私人财产在公共通行权中预留停车位并不是标准做法。
使人工智能代理与人类意图和价值观保持一致是构建安全且可部署的人工智能应用的关键瓶颈。但人工智能代理应该与谁的价值观保持一致?强化学习与人类反馈 (RLHF) 已成为人工智能对齐的关键框架。RLHF 使用来自人类强化器的反馈来微调输出;所有广泛部署的大型语言模型 (LLM) 都使用 RLHF 使其输出与人类价值观保持一致。了解 RLHF 的局限性并考虑由这些局限性引起的政策挑战至关重要。在本文中,我们研究了构建尊重民主规范的 RLHF 系统的一个特定挑战。基于社会选择理论中的不可能结果,我们表明,在相当广泛的假设下,没有独特的投票协议可以通过民主程序使用 RLHF 普遍对齐人工智能系统。此外,我们表明,使人工智能代理与所有个人的价值观保持一致将始终违反个人用户的某些私人道德偏好,即使用 RLHF 进行普遍的人工智能对齐是不可能的。我们讨论了使用 RLHF 构建的 AI 系统治理的政策含义:首先,需要强制执行透明的投票规则,以追究模型构建者的责任。其次,模型构建者需要专注于开发与特定用户群体紧密结合的 AI 代理。
摘要 目的。我们研究了最近引入的基于元学习的迁移学习技术是否可以提高脑机接口 (BCI) 在决策信心预测方面的性能,而传统机器学习方法则无法实现。方法。我们将偏向正则化算法的元学习应用于基于视频馈送的困难目标识别任务中,根据脑电图 (EEG) 和眼电图 (EOG) 数据逐个决策地预测决策信心的问题。该方法利用以前参与者的数据来生成预测算法,然后快速调整该算法以适应新参与者。我们将该方法与 BCI 中几乎普遍采用的传统单受试者训练、一种称为领域对抗神经网络的最先进的迁移学习技术、我们最近用于类似任务的零训练方法的迁移学习改编以及简单的基线算法进行了比较。主要结果。在大多数情况下,元学习方法明显优于其他方法,在只有来自新参与者的有限数据可用于训练/调整的情况下,效果要好得多。通过有偏正则化的元学习,我们的 BCI 能够无缝集成来自过去参与者的信息与来自特定用户的数据,以产生高性能预测器。它在小型训练集存在下的稳健性是 BCI 应用中的真正优势,因为新用户需要在更短的时间内训练 BCI。意义。由于 EEG/EOG 数据的多变性和噪声,BCI 通常需要使用来自特定参与者的数据进行训练。这项工作表明,使用我们的有偏正则化元学习版本可以获得更好的性能。
基于人工智能的多维数据库技术是一项新技术。该技术可以实现多模态数据(非结构化数据、半结构化数据、结构化数据)的分布式存储,同时还可以将数据以超立方体的形式存储,并对数据进行实时的多维分析和查询。传统的多维数据库直接从二维表中提取维度信息,没有考虑维度信息之间的关联性。因此,结合人工智能技术,可以实现多模态数据的关联分析,自动生成维度信息。具体而言,针对商业智能(BI)领域对多维数据高效分析、存储和处理的需求,开展基于人工智能的多维数据库技术应用研究,实现多领域异构数据的统一采集,高效、实时、自动标注、聚类,数据信息智能提取及语义关联,超立方体存储和在线分析OLAP、在线分析处理等。设计基于人工智能的多维数据库原型系统,满足海量数据智能分析处理需求。系统学习用户的查询行为模式和数据特征。通过内置机器学习算法构建立方体数据模型。持续进行模型优化,针对特定用户精准生成查询结果。通过分布式算法引擎、混合在线分析处理、分布式存储引擎等人工智能功能模块,整合多源异构数据资源,实现数据关联、智能学习、推理和预测,为管理决策端和业务运营端提供更加完善、可靠的预测决策服务。
与标准护理相比,心力衰竭患者中基于家庭的远程监控可以降低全因死亡率和与心力衰竭相关的住院治疗的相对风险。但是,技术使用取决于用户接受,这使得在开发中包括潜在用户很重要。在一个家庭的医疗保健项目(一个peasibil-ity项目)中,选择了一种参与式方法,以准备未来开发心脏病患者中基于非接触式摄像机的远程监控。对项目研究患者(n = 18)进行了有关接受和设计期望的调查,然后从结果中得出了增强措施和设计建议。研究患者对应于潜在未来用户的目标群体。83%的响应量显示出很高的接受度。接受调查的人中有17%的人更持怀疑态度,接受中等或低接受。后者是女性,主要是独自生活,没有技术实验。低接受度与更高的努力期望和较低的自我效能感和较低的整合性与每日节奏相关。对于设计,受访者发现该技术的独立操作非常重要。此外,人们对新的测量技术表示担忧,例如对稳定监视的焦虑。接受新一代的医疗技术(基于非接触式摄像机的测量技术),对远程人士的老年用户(60+)已经很高。在开发过程中应考虑有关设计的特定用户期望,以增加潜在用户的接受。
摘要以下项目涉及基于多感应刺激的积极情绪支持应用的建议。该项目的第一个目标是研究情绪与情绪之间的差异,关系和互动,试图了解情绪识别方法和引起刺激如何在情绪领域进行调整。这是构建旨在检测用户心情并随时间进行监控的系统的基本步骤,同时试图通过提出适当的多感官刺激来支持积极的情绪。因此,另外两个中间步骤至关重要:i)使用可穿戴设备和简短问卷结合使用的可穿戴设备来构建多式模式检测框架; ii)定义多种感官刺激应表现出哪些视听特征,以增强其积极的情绪支持效果,从而利用不同的学习模型。将在用户第一次访问系统时提交分析调查表。然后,进行了多模式情绪检测,并对当前的情绪和智能手机和可穿戴设备(例如环境,行为和生理数据)的数据进行了生态瞬时评估(EMA)。由于定义了用户的当前情绪,因此系统会自动选择适当的视听刺激,以提示如果需要的话,可以改善情绪。情绪支持会话后,将需要用户的反馈来提高系统的有效性,并确保为特定用户提供更好的刺激。案例研究将被视为了解该系统在实际应用中的功效。特别是,将开发一种汽车场景,在驾驶模拟过程中利用虚拟现实刺激。
Facebook和其他广告平台通过允许广告商选择特定用户并用精心制作的消息来瞄准用户的数据来利用用户的数据(该实践称为微目标)。但是,诸如Cambridge Analytica之类的广告客户恶意使用这些定位功能在选举中操纵用户。欧洲委员会计划在《新欧洲民主行动计划法》中限制甚至禁止某些目标功能,以保护用户免受这种伤害。难以找到适当的限制,我们不知道这些限制对常规广告商的经济影响。在本文中,为了告知辩论,我们通过了解谁在Facebook上进行广告以及他们如何使用广告平台的目标功能迈出了第一步。为此,我们要求890个美国用户在其浏览器上安装监视工具,以收集他们在Facebook上收到的广告,以及有关这些广告的目标的信息。通过将Facebook上的广告客户与他们的LinkedIn配置文件匹配,我们可以看到71%的广告客户是中小型企业,有200名员工或更少的员工,他们负责61%的广告和57%的广告印象。关于微目标,我们发现我们的数据集微目标中只有32%的中小型企业和30%的大型企业至少一个广告。这些结果不应被解释为微目标不是作为营销策略而有用的,而是广告商更喜欢将微目标任务外包给广告平台。的确,为了传递广告,Facebook正在采用优化算法来利用用户数据来确定哪些用户应查看哪些广告;这基本上意味着广告平台正在执行算法驱动的微目标。因此,在设定微目标的限制时,立法者应考虑传统广告客户驱动的微目标以及广告平台执行的算法驱动的微目标。
肌电控制,在肌肉收缩期间生成的肌电图(EMG)信号来控制系统或设备,是一种有希望的方式,可实现对新兴无处不在的计算应用程序的始终可用控制。但是,由于用户之间的行为和生理差异,其历史上的广泛使用受到对用户特定机器学习模型的需求的限制。利用公开可用的612-用户EMG-EPN612数据集,这项工作消除了这一概念,表明如果没有特定用户的培训,则可以实现真正的零射击交叉用户肌电控制。通过采用离散的分类方法(即,将整个动态手势视为一个事件),在一组306个未见的用户(没有提供培训数据)的一组中,可以实现六个手势的分类精度为93.0%,与大多数EMG研究(通常仅使用10-20个用户相比),可以雇用强大的交叉控制。通过将结果组织成一系列的小型研究,这项工作提供了对离散跨用户模型的深入分析,以回答未知问题并发现新的研究方向。特别是,这项工作探讨了建立跨用户模型所需的参与者数量,转移学习对这些模型的影响以及代表性不足的最终用户人口统计数据在培训数据中的影响等。结果表明,大型数据模型可以有效地推广到新的数据集,并减轻历史上限制基于EMG的输入的常见混杂因素的影响。另外,为了进一步评估创建的跨用户模型的性能,创建了一个全新的数据集(使用相同的记录设备),其中包括已知的协变量因子,例如跨日使用和肢体位置可变性。
脑机接口 (BCI) 使用户能够通过大脑活动来控制设备。运动意象 (MI) 是一种常见的控制范式,即个人想象执行动作时产生的神经活动。本研究介绍了一种以用户为中心的评估协议,用于评估利用增强现实的基于 MI 的 BCI 控制系统的性能和用户体验。增强现实用于通过显示环境感知动作来增强用户交互,并指导用户进行特定设备命令所需的想象动作。现有研究的主要差距之一是缺乏全面的评估方法,尤其是在现实条件下。为了解决这一差距,我们的协议结合了三个阶段的定量和定性评估。在初始阶段,验证 BCI 原型的技术稳健性。随后,第二阶段涉及控制系统的性能评估。第三阶段引入原型与替代方法之间的比较分析,结合通过问卷调查和与非 BCI 控制方法的比较进行详细的用户体验评估。参与者使用 BCI 控制系统执行各种任务,例如物体分类、拾取和放置以及玩棋盘游戏。评估程序的设计具有多功能性,旨在超越所介绍的特定用例。它的适应性使其易于定制,以满足所研究的 BCI 控制应用程序的特定用户要求。这种以用户为中心的评估协议为 BCI 原型的迭代改进提供了一个全面的框架,确保以系统和以用户为中心的方式进行技术验证、性能评估和用户体验评估。