Bernstein、Charleton Copeland、Dan Deacon、Rebecca Eisenberg、Michael Froomkin、Jim Gibson、Patrick Gudridge、Kristian Hammond、Corinna Lain、Matt Sag、Andres Sawicki、Alex Stremitzer、Charlotte Tschider 和 Christopher Yoo。感谢 Luca Baltensberger、Rabea Benhalim、Ana Bracic、Christopher Corts、Sue Glueck、Claudia Haupt、Fiona Illi、Izzy Longstaff、Andrea Matwyshyn、Emily McReynolds、Aileen Neilson、Paul Ohm、Nadav Orien-Peer、Gabriel Rauterberg、Blake Reid、Nikkita Rivera、Andrew Selbst、Lawrence Solum、Sloan Speck、Elizabeth Stalfort 和 Harry Surden 提供的有益评论和对话。本文受益于 AALS 2020 年会、苏黎世联邦理工学院和苏黎世大学与圣加仑大学创新法律与经济学研讨会、人工智能法律学者圆桌会议、西北大学、宾夕法尼亚大学和斯坦福大学法学院法律与 STEM 青年教师论坛、隐私法学者会议、里士满法学院教师研讨会、迈阿密大学法学院法律理论研讨会、密歇根大学法学院治理研讨会、密歇根大学人工智能与法律研讨会、Techlaw 青年学者研讨会和 We Robot 会议的慷慨反馈。我们感谢 Nathan Fuller、Abbi Lynch、Phoebe Roque、Rylee Snively 和 Angela Theodoropoulos 提供的出色研究协助。Nicholson Price 的工作得到了 Novo Nordisk 基金会 (拨款编号 NNF17SA0027784) 的支持。代表我们每个人:所有错误都是我的合著者的。
目前,深度学习模型在现实世界的面部识别任务中达到了人类水平。我们回顾了使用基于深度学习的计算方法理解人脸处理的科学进展。这篇综述围绕三个基本进展展开。首先,经过面部识别训练的深度网络会生成一个表示,该表示保留了有关面部(例如身份、人口统计、外观、社交特征、表情)和输入图像(例如视点、照明)的结构化信息。这迫使我们重新思考视觉逆光学问题的可能解决方案。其次,深度学习模型表明,面部的高级视觉表示无法从可解释的特征方面来理解。这对理解高级视觉皮层中的神经调节和群体编码具有重要意义。第三,深度网络中的学习是一个多步骤的过程,迫使人们从理论上考虑各种可以重叠、随时间积累和相互作用的学习类别。需要多种学习类型来模拟人类面部处理技能的发展、跨种族效应以及对个人面孔的熟悉程度。
摘要 随着人工智能 (AI) 在工业和社会中的广泛应用,有效的人机交互系统变得越来越重要。人类与人工智能交互的一个核心挑战是估计人类和人工智能代理在单个任务实例中的难度。这些估计对于评估每个代理的能力至关重要,因此需要促进有效的协作。到目前为止,人机交互领域的研究是独立估计人类和人工智能的感知难度。然而,人类和人工智能代理的有效互动取决于准确反映每个代理在实现有价值结果方面的感知难度的指标。迄今为止的研究尚未充分研究人类和人工智能感知难度的差异。因此,这项工作回顾了最近关于人机交互感知难度的研究以及一致比较每个代理感知难度的促成因素,例如创建相同的先决条件。此外,我们提出了一个实验设计来彻底检查两个代理的感知难度,并有助于更好地理解此类系统的设计。
根据本许可条款,本作品可复制、重新分发和改编,但需适当引用。使用本作品时,不得暗示世界动物卫生组织 (WOAH) 和/或世界银行 (WB) 认可任何特定组织、产品或服务。不得使用 WOAH 或 WB 徽标。如果改编本作品,则必须根据相同或等效的知识共享许可进行授权。如果翻译本作品,则必须包含以下免责声明以及所需的引用:“本翻译不是由世界动物卫生组织 (WOAH) 或世界银行 (WB) 创作的。WOAH 和 WB 对本翻译的内容或准确性不承担任何责任。原始英文版应为权威版本。”
机器智能与人类智能的结合有可能赋予人类增强的能力(例如,在写歌词时提高押韵密度,通过情绪检测增强同理心,以及在在线课程中个性化学习)。不幸的是,人类生活在一个不确定的世界中 - 即使是最先进的以模型为中心的人工智能系统的性能也常常取决于它以数据为中心处理其训练标签的不确定性的能力。为此,我们引入了置信学习,即机器(像人类一样)必须使用带有噪声的标签数据进行学习,直接量化和识别标签噪声,并通过在清除错误标签的清理数据上自信地重新学习来消除误解。我们通过开发一个用于置信学习的原则性理论和框架来实现这一目标,该理论和框架具有量化、识别和学习数据中标签错误的能力,并且我们在 cleanlab Python 包中开源了它们的实现。根据使用 cleanlab 发现的标签错误的人工验证:我们估计音频、图像和文本模态中十个最常用的机器学习数据集的测试集标签的最低错误率为 3.4%;检查改变机器基准排名所需的噪声普遍性;并提供更正的测试集,以便人类可以更自信地对机器性能进行基准测试。然后,我们构建并评估了三个人工智能系统,以增强人类在嘈杂的现实环境中的能力。即:(1)通过结合来自多个同步视角的嘈杂具体音频和视频信号来辅助多人对话中的轮流发言,(2)通过利用语言和语义固有的随机不确定性来辅助生成歌词,以及(3)通过去极化/多样化评论排名来辅助人类在开放式在线课程中的学习,以减轻基于赞成票的排名中固有的多数偏见。在每种情况下,人工智能系统克服不确定性的能力都与其增强人类能力的功效相关,并且进一步说,与人类对执行相关任务的能力的信心相关。
我们提出了三个更详细的问题来指导我们:(1)人类和人工智能在决策过程中扮演什么角色?(2)组织设计如何通过使用人工智能来支持决策过程?(3)人工智能如何帮助知识密集型企业的决策者克服所面临的挑战,以及在决策过程中使用人工智能会带来哪些新挑战?我们采用了解释主义范式和定性研究,如第 3 节所述。我们在两家使用人工智能的大型 IT 公司和两家房地产初创公司中调查了我们的研究主题。我们进行了六次半结构化访谈,以便我们更好地了解和深入了解人类和人工智能在知识密集型企业决策过程中的角色。我们的审查使我们得出了第 2 节中解释的理论框架,我们以此为基础进行采访。从访谈中得出的结果和发现遵循与理论审查相同的结构,并提供了有见地的信息以回答研究问题。为了分析和讨论第 5 章和附录 4 中的图表中总结的实证研究结果,我们使用了定性研究的一般分析程序。第 5 章的结构遵循与三个子问题相同的顺序
机器智能与人类智能的结合有可能赋予人类增强的能力(例如,在写歌词时提高押韵密度、通过情绪检测增强同理心以及在在线课程中个性化学习)。不幸的是,人类生活在一个不确定的世界中 - 即使是最复杂的以模型为中心的人工智能系统的性能也常常取决于其以数据为中心处理其训练标签的不确定性的能力。为此,我们引入了自信学习,即机器(像人类一样)必须使用带有噪声的标签数据进行学习,直接量化和识别标签噪声,并通过对已清除错误标签的清洁数据进行自信地重新学习来消除误解。我们通过开发自信学习的原则理论和框架来实现这一目标,该理论和框架具有量化、识别和学习数据中标签错误的能力,并且我们在 cleanlab Python 包中开源了它们的实现。根据使用 cleanlab 发现的标签错误的人工验证:我们估计音频、图像和文本模态中十个最常用的机器学习数据集的测试集标签的最低错误率为 3.4%;检查改变机器基准排名所需的噪声普遍性;并提供更正的测试集,以便人类可以更自信地对机器性能进行基准测试。然后,我们构建并评估了三个人工智能系统,以增强人类在嘈杂的现实环境中的能力。即:(1)通过结合来自多个同步视角的嘈杂具体音频和视频信号来辅助多人对话中的轮流发言,(2)通过利用语言和语义固有的随机不确定性来辅助生成歌词,以及(3)通过去极化/多样化评论排名来辅助人类在开放式在线课程中的学习,以减轻基于赞成票的排名中固有的多数偏见。在每种情况下,人工智能系统克服不确定性的能力都与其增强人类能力的功效相关,进而与人类对其执行相关任务的能力的信心相关。
随着机器学习的进步,自主代理越来越能够驾驭不确定的作战环境,就像多域作战 (MDO) 范式中的情况一样。与人类合作时,自主代理可以根据任务要求和合作伙伴(无论是人类还是代理)采取的行动,灵活地在被动旁观者和主动执行者之间切换。在许多任务中,训练有素的代理的表现可能会超过人类,部分原因是代理的表现不太可能随着时间的推移而下降(例如,由于疲劳)。这种潜在的性能差异可能会导致自满,这是一种由对自动化系统的过度信任定义的状态。本文研究了自满在人机团队中的影响,其中代理和人类在模拟版本的捕食者-猎物追击任务中具有相同的能力。我们使用各种量表比较人类对自满和信任倾向的主观衡量标准,并通过与任务期间采取的行动相关的各种指标量化自满,以验证他们的信念,这些指标与可靠性水平不同的训练有素的代理一起执行任务。通过评估自满对绩效的影响,我们可以将人类在此任务中的表现一定程度上归因于自满。然后,我们可以考虑个人的自满度量,以定制他们的代理队友和人类在环要求(以最小化或 c
这些启发式方法和其他方法由逻辑理论机器使用。它在逻辑“类似”中搜索与要证明的表达式相似的定理(例如,其中的变量数量大约相同);它从最终结果向后起作用;它尝试一种推理方法,如果不起作用,则尝试切换到另一种方法。它记得它所证明的定理,以便它可以在以后的定理中使用这些定理;它记得在处理特定类型的定理方面成功的方法,并应用了这些知识。并通过使用这些设备,逻辑理论机器设法将其任务减少为合理的比例;实际上,它成功证明了许多定理。而且它写的证据非常类似于A. N. Whitehead和Bertrand Russell获得的证据,五十年前,他们写了Mathematica Princiaia Mathematica,这是现代符号逻辑的基础。
为了了解听觉皮层处理过程,我们在 171 名人类连接组计划参与者中测量了 15 个听觉皮层区域和 360 个皮层区域之间的有效连接,并辅以功能连接和扩散纤维束成像。1. 确定了听觉皮层处理的层次结构,从核心区域(包括 A1)到带区 LBelt、MBelt 和 52;然后到 PBelt;然后到 HCP A4。2. A4 与前颞叶 TA2 和 HCP A5 相连,后者连接到背侧颞上沟 (STS) 区域 STGa、STSda 和 STSdp。这些 STS 区域还接收有关移动面部和物体的视觉输入,这些信息与听觉信息相结合,有助于实现多模态物体识别,例如谁在说话以及说了什么。与此“什么”腹侧听觉流一致,这些 STS 区域随后与 TPOJ1、STV、PSL、TGv、TGd 和 PGi 具有有效连接,这些区域是与布罗卡区(尤其是 BA45)连接的语言相关语义区域。3. A4 和 A5 还与 MT 和 MST 具有有效连接,后者连接到顶叶上部区域,形成与空间动作有关的背侧听觉“哪里”流。PBelt、A4 和 A5 与 BA44 的连接可能形成与语言相关的背侧流。