摘要 智能代理必须能够传达意图并解释其决策过程,以建立信任、培养信心并改善人机团队动态。认识到这一需求,学术界和工业界正在迅速提出新的想法、方法和框架,以帮助设计更可解释的人工智能。然而,仍然没有标准化的指标或实验协议来对新方法进行基准测试,研究人员只能依靠自己的直觉或临时方法来评估新概念。在这项工作中,我们提出了第一个全面的(n=286)用户研究,测试了可解释机器学习的广泛方法,包括特征重要性、概率分数、决策树、反事实推理、自然语言解释和基于案例的推理,以及没有解释的基线条件。我们提供了可解释性对人机团队影响的第一个大规模实证证据。我们的研究结果将通过强调反事实解释的好处和可解释性置信度得分的缺点,帮助指导可解释性研究的未来。我们还提出了一种新颖的问卷,用于衡量人类参与者的可解释性,该问卷受到相关先前工作的启发,并与人机协作指标相关联。
摘要 人工智能 (AI) 技术极大地重塑了社交媒体上的用户体验。人工智能驱动的社交媒体的使用及其结果在很大程度上取决于用户如何与行使代理权的人工智能协作。通过对 TikTok 用户的深入访谈,本研究调查了用户在使用人工智能驱动的社交媒体时如何与人工智能协作,以及这种动态如何影响用户参与度。我们发现 TikTok 用户愿意接受机器代理带来的个性化体验。然而,通过相互影响,用户代理和机器代理也导致了用户与人工智能的协同作用。用户有意影响内容策划算法,使其更精确地满足他们的需求;人工智能还促进了用户的内容创作和交流。TikTok 上的这种人工智能与用户的协作显著影响了媒体参与度和社交互动参与度。这些发现加深了我们对人类代理和机器代理之间动态的理解,从而了解了人工智能如何改变社交媒体上的用户体验。
自 2010 年代中期以来,无人驾驶飞行器(通常称为无人机)的普及度急剧上升,根据美国联邦航空管理局的数据,从 2016 年注册第一年的 60 万架增加到 2021 年的约 180 万架(FAA,2021 年)。这些无人机大多数是个人无人机,但其中约四分之一注册为商用无人机。商用无人机正用于房地产、农业、建筑和采矿等许多领域。它们主要用于检查和监视任务,因为它们能够访问远程位置并使用安装的摄像头录制高质量的镜头。然而,无人机很快也将用于送货,许多公司,例如美国的亚马逊(Palmer,2020 年)和中国的京东都已启动有限的无人机送货系统(McNabb,2019 年)。商用无人机的采用率正在迅速上升。预计该行业全球市场规模将从 2019 年的 15.9 亿美元增长到 2027 年的 85.27 亿美元,其中北美市场将占据主导地位(《财富商业洞察》,2020 年)。
自动文本摘要系统通常需要人类来准备数据或评估模型性能,然而,人们缺乏对人类在与人工智能交互或接受人工智能协助时的角色、经验和需求的系统理解。从以人为本的角度,我们绘制了文本摘要和更广泛的文本生成任务中人机交互的设计机会和考虑因素。我们首先对 70 篇论文进行了系统的文献综述,开发了人工智能辅助文本生成中的五种交互分类法和相关的设计维度。我们为每种交互设计了文本摘要原型。然后,我们在原型的帮助下采访了 16 位用户,以了解他们对人工智能在文本摘要中的效率、控制和信任的期望、经验和需求,并据此提出了设计考虑因素。
自动文本摘要系统通常需要人类来准备数据或评估模型性能,然而,人们缺乏对人类在与人工智能交互或接受人工智能协助时的角色、经验和需求的系统理解。从以人为本的角度,我们绘制了文本摘要和更广泛的文本生成任务中人机交互的设计机会和考虑因素。我们首先对 70 篇论文进行了系统的文献综述,开发了人工智能辅助文本生成中的五种交互分类法和相关的设计维度。我们为每种交互设计了文本摘要原型。然后,我们在原型的帮助下采访了 16 位用户,以了解他们对人工智能在文本摘要中的效率、控制和信任的期望、经验和需求,并据此提出了设计考虑因素。
允许免费制作本作品的全部或部分数字版或硬拷贝,供个人或课堂使用,但不得出于营利或商业目的而制作或分发副本,并且副本首页必须带有此声明和完整引文。必须尊重作者以外的其他人拥有的本作品组成部分的版权。允许摘要并注明出处。要以其他方式复制、重新发布、发布到服务器或重新分发到列表,需要事先获得特定许可和/或付费。向 permissions@acm.org 申请许可。CHI '22,2022 年 4 月 29 日至 5 月 5 日,美国路易斯安那州新奥尔良 © 2022 版权归所有者/作者所有。出版权已授权给 ACM。 ACM ISBN 978-1-4503-9157-3/22/04...$15.00 https://doi.org/10.1145/3491102.3517719
最近的研究表明,选择性预测系统具有潜在的优势,当人工智能的预测不可靠时,该系统可以学会听从人类的预测,尤其是在提高人工智能系统在医疗保健或保护等高风险应用中的可靠性方面。然而,大多数先前的研究都假设,当人类作为人机团队的一员而不是自己解决预测任务时,人类的行为保持不变。我们通过进行实验来量化选择性预测背景下的人机交互,表明情况并非如此。特别是,我们研究了向人类传达有关人工智能系统推迟决定的不同类型信息的影响。使用现实世界的保护数据和选择性预测系统(与人类或人工智能系统单独工作相比,该系统的预期准确度有所提高),我们表明这种信息传递对人类判断的准确性有显著影响。我们的结果研究了信息传递策略的两个组成部分:1) 人类是否被告知人工智能系统的预测;2) 人类是否被告知选择性预测系统的推迟决定。通过操纵这些消息传递组件,我们表明,通过向人类告知推迟的决定,但不透露人工智能的预测,可以显著提高人类的表现。因此,我们表明,在设计选择性预测系统时,考虑如何将推迟的决定传达给人类是至关重要的,并且必须使用人在环框架仔细评估人机团队的综合准确性。
背景 理解人工智能 (AI) 并思考其影响面临着巨大的挑战。解决这个问题的一个有效方法是推测设计 (SD),它主要涉及构建叙事,以激发对技术设计和社会采用的讨论。然而,在人工智能背景下对 SD 叙事的研究很少。因此,本研究旨在确定 SD 中涉及人机交互的叙事主题。
酒店业的语音助理:使用人工智能为客户服务。目的——语音助理 (VA) 通过识别人类语音并执行用户发出的命令来增强人机交互。本文研究了酒店业中酒店与客人之间基于 VA 的互动。该研究将 VA 置于人工智能 (AI) 支持的物联网 (IoT) 环境中,颠覆了旧的做法和流程。智能酒店业使用 VA 以经济高效的方式为客人提供轻松的价值共同创造。该研究调查了消费者对酒店业 VA 的看法和期望,并通过专家技术提供商探索 VA 功能。设计/方法/方法——这篇实证论文研究了 VA 在酒店环境中的当前使用情况和未来影响。它使用定性、半结构化的深入访谈,采访了 7 位专家酒店业 VA 技术提供商和 21 位有 VA 经验的酒店客人。该研究采用供需方法,全面解决酒店业中的 VA。发现——研究结果表明,酒店和客人两方终端用户的需求,探讨了 VA 的优势和挑战。分析表明,VA 正日益成为数字助理。VA 技术可帮助酒店改善客户服务、扩大运营能力并降低成本。尽管尚处于起步阶段,但 VA 技术已在优化酒店运营和升级客户服务方面取得了进展。该研究提出了一种语音交互模型。原创性——VA 研究通常侧重于私人家庭中的技术,而不是商业或酒店空间中的技术。本文为智能酒店业中有关人工智能和物联网的新兴文献做出了贡献,并探讨了 VA 的接受度和操作性。该研究有助于概念化 VA 支持的酒店服务,并探索其积极和消极特征以及未来前景。研究局限性/含义——本研究通过使用 VA 和智能酒店和旅游生态系统的发展来促进酒店服务的转型。该研究可以从与酒店经理的进一步研究中受益,以反映酒店经营者的观点并调查他们对 VA 的看法。进一步的研究还可以探索不同背景下消费者与虚拟助理互动的不同方面。实际意义——本文对酒店管理和人机交互最佳实践做出了重大贡献。它支持技术提供商重新考虑如何开发合适的技术解决方案,以提高其战略竞争力。它还解释了如何经济高效地使用虚拟助理,同时为旅行者的体验增加价值。
信任已成为人们与 AI 系统交互的关键因素。然而,人们对信任模型的使用以及用于哪些系统知之甚少:机器人、虚拟角色、智能车辆、决策辅助工具或其他。此外,目前还没有已知的衡量 AI 信任的标准方法。本范围审查从模型、措施和方法的角度概述了人机交互 (HAII) 中的信任状况。研究结果表明,信任是 HAII 背景下的一个重要且多方面的研究主题。然而,大多数工作理论化不足且报告不足,通常不使用已建立的信任模型,并且缺少有关方法的详细信息,尤其是绿野仙踪。我们为系统审查工作提供了几个目标,以及一个研究议程,以结合当前文献的优势并解决其弱点。