大型语言模型 (LLM),例如生成式预训练 Transformer 3 (GPT-3) [ 3 ],因其生成文本内容的能力而引起了研究人员和从业人员的极大关注。ChatGPT 1 的迅速成功——推出仅两个月后月活跃用户就达到 1 亿,创下了历史上增长最快的消费者应用记录 2——不仅凸显了生成式 AI 在生成精确和个性化文本内容方面的潜力和能力,而且凸显了界面和交互在与 AI 通信中的关键作用。由于 ChatGPT 是针对对话任务进行了微调的 GPT-3 变体,因此技术基础保持相似;相反,主要区别似乎是人机交互范式的转变,
1.1 概念、定义以及与人工智能和自主系统交互的历史 20 世纪 40 年代末,人们开始研究与人工智能相关的主题,1950 年,人们发表了多篇关于该主题的出版物。(Grudin, 2009, p. 49) 然而,人工智能这个术语最早是在 1956 年数学家和逻辑学家 John McCarthy 的研讨会征集活动中提出的。第一批关于人工智能的研究是由工程师和数学家完成的,他们的目标是创造出可以与人类智能相媲美的技术,就像计算机在算术领域与人类相媲美一样。(Grudin, 2009, p. 48) 人工智能的三种定义 人工智能的定义和描述方式各不相同。作家帕梅拉(McCorduck,2004)写了一本关于人工智能历史的书,她将人工智能定义为(...)大胆地试图在人工制品中复制我们人类认为最重要的、最具识别性的财产——我们的智慧。罗素和诺维格将人工智能的定义分为四类,其中的定义沿着思考与行动、类人行为与理性行为的维度收集。设计师 Bratteteig 和 Verne 为他们的论文选择了人工智能的定义,该定义反映了人工智能旨在像人一样行动:人工智能是计算机科学的一个子领域,旨在指定和制造模仿人类智能或表达理性行为的计算机系统,从某种意义上说,如果由人类执行任务,则需要智能(Bratteteig & Verne,2018;Russell 等人,2010)。我的定义 回顾这些定义,我对人工智能的描述可能是:人工智能是一个术语,它描述了一系列技术,这些技术从概念发展到对人类推理、学习、解决问题、决策和行动能力的计算过程进行建模。人工智能技术的发展方向已经多种多样。
人工智能的历史:人工智能,简称AI,挪威语(KI)也称为人工智能,以下简称AI,于1956年正式形成。这在当时被称为现代人工智能。哲学家试图将人类思维描述为符号系统(Lewis,2014)。人工智能一词本身来自计算机技术领域的教授约翰·麦卡锡 (John McCarthy)。我们也不能忘记阿兰·图灵,他创造了一台突破性的机器,探索人工智能的数学可能性(Anyoha,2017)。这样,我们可以将图灵视为人工智能的创造者。人工智能的定义:如上所述,麦卡锡可以被认为是人工智能之父,因为他对信息学和人工智能领域的参与(Solutions,2020)。麦卡锡将人工智能定义为:
摘要 智能代理必须能够传达意图并解释其决策过程,以建立信任、培养信心并改善人机团队动态。认识到这一需求,学术界和工业界正在迅速提出新的想法、方法和框架,以帮助设计更可解释的人工智能。然而,仍然没有标准化的指标或实验协议来对新方法进行基准测试,研究人员只能依靠自己的直觉或临时方法来评估新概念。在这项工作中,我们提出了第一个全面的(n=286)用户研究,测试了可解释机器学习的广泛方法,包括特征重要性、概率分数、决策树、反事实推理、自然语言解释和基于案例的推理,以及没有解释的基线条件。我们提供了可解释性对人机团队影响的第一个大规模实证证据。我们的研究结果将通过强调反事实解释的好处和可解释性置信度得分的缺点,帮助指导可解释性研究的未来。我们还提出了一种新颖的问卷,用于衡量人类参与者的可解释性,该问卷受到相关先前工作的启发,并与人机协作指标相关联。
自动文本摘要系统通常需要人类来准备数据或评估模型性能,然而,人们缺乏对人类在与人工智能交互或接受人工智能协助时的角色、经验和需求的系统理解。从以人为本的角度,我们绘制了文本摘要和更广泛的文本生成任务中人机交互的设计机会和考虑因素。我们首先对 70 篇论文进行了系统的文献综述,开发了人工智能辅助文本生成中的五种交互分类法和相关的设计维度。我们为每种交互设计了文本摘要原型。然后,我们在原型的帮助下采访了 16 位用户,以了解他们对人工智能在文本摘要中的效率、控制和信任的期望、经验和需求,并据此提出了设计考虑因素。
自动文本摘要系统通常需要人类来准备数据或评估模型性能,然而,人们缺乏对人类在与人工智能交互或接受人工智能协助时的角色、经验和需求的系统理解。从以人为本的角度,我们绘制了文本摘要和更广泛的文本生成任务中人机交互的设计机会和考虑因素。我们首先对 70 篇论文进行了系统的文献综述,开发了人工智能辅助文本生成中的五种交互分类法和相关的设计维度。我们为每种交互设计了文本摘要原型。然后,我们在原型的帮助下采访了 16 位用户,以了解他们对人工智能在文本摘要中的效率、控制和信任的期望、经验和需求,并据此提出了设计考虑因素。
新基础设施项目的快速发展要求在新的环境中加速部署新材料。材料 4.0 对于实现这些目标至关重要。多年来,数字化在材料领域的应用一直处于研究的前沿,但目前尚无统一的方法来描述该领域的框架,从而创造出发展空间。这与人们对数字孪生 (DT) 的更广泛期望相混淆,因为数字孪生是所有这些问题的可能答案。问题在于,没有公认的组件 DT 定义,以及它应该包含哪些信息以及如何在整个产品生命周期中实施它。在本立场文件中,明确区分了“制造 DT”和“组件 DT”;前者是后者的起始边界条件。为了实现这一点,我们还讨论了引入数字线程作为将数据从制造传递到服务的关键概念。给出了从材料角度定义 DT 开发框架的阶段,承认了在学术界创造新理解与在工业中逐个组件应用这些知识之间的区别。确定了组件 DT 广泛应用的许多挑战;所有这些都会导致属性和位置的不确定性,解决这些问题需要在提供安全相关的材料属性数据时做出判断。
随着自动化机器学习 (AutoML) 系统在复杂程度和性能方面不断进步,了解这些框架中人机交互 (HCI) 的“如何”和“为什么”变得非常重要,包括当前的和预期的。这样的讨论对于最佳系统设计是必要的,利用先进的数据处理能力来支持涉及人类的决策,但它也是识别不断提高的机器自主性水平所带来的机遇和风险的关键。在此背景下,我们重点关注以下问题:(i) 对于最先进的 AutoML 算法来说,HCI 目前是什么样子,特别是在开发、部署和维护阶段?(ii) AutoML 框架内对 HCI 的期望是否因不同类型的用户和利益相关者而异?(iii) 如何管理 HCI,以便 AutoML 解决方案获得人类的信任和广泛接受?(iv) 随着 AutoML 系统变得更加自主并且能够从复杂的开放式环境中学习,HCI 的基本性质会发生变化吗?为了考虑这些问题,我们将 HCI 中的现有文献投射到 AutoML 领域;到目前为止,这种联系基本上还没有得到探索。为此,我们回顾了包括用户界面设计、人为偏见缓解和对人工智能 (AI) 的信任等主题。此外,为了严格衡量 HCI 的未来,我们考虑了 AutoML 如何在有效开放的环境中体现。这
摘要:飞机维护是一个复杂的领域,设计包含机器学习 (ML) 算法的新系统可能成为一项挑战。在设计用于飞机维护规划的基于条件的维护 (CBM) 工具的背景下,本案例研究涉及 (1) 使用 Playful Probing 方法来获取洞察,从而了解如何设计与 ML 算法的交互,(2) 集成强化学习 (RL) 代理以实现维护规划中的人机协作以及 (3) CBM 指标的可视化。使用设计科学研究方法,我们设计了 Playful Probe 协议和材料,并通过举办参与式设计研讨会来评估结果。我们的主要贡献是展示如何引出将维护规划实践与 ML 估算工具和 RL 代理相结合的想法。通过参与式设计研讨会并让参与者观察如何使用 CBM 工件,Playful Probes 有利于引出用户与 RL 规划代理的交互需求,以帮助规划人员获得可靠的维护计划,并有可能理解如何表示 CBM 指标并通过轨迹预测将其可视化。
信任已成为人们与 AI 系统交互的关键因素。然而,人们对信任模型的使用以及用于哪些系统知之甚少:机器人、虚拟角色、智能车辆、决策辅助工具或其他。此外,目前还没有已知的衡量 AI 信任的标准方法。本范围审查从模型、措施和方法的角度概述了人机交互 (HAII) 中的信任状况。研究结果表明,信任是 HAII 背景下的一个重要且多方面的研究主题。然而,大多数工作理论化不足且报告不足,通常不使用已建立的信任模型,并且缺少有关方法的详细信息,尤其是绿野仙踪。我们为系统审查工作提供了几个目标,以及一个研究议程,以结合当前文献的优势并解决其弱点。
