注:该表显示了十二个机构层面回归的估计值,以基线机构员工人数为权重。自始至终,结果变量是人工智能空缺职位、非人工智能空缺职位和员工人数的反双曲正弦的变化乘以 100。回归量是 Felten 等人(2018)的人工智能暴露指标,即基线机构员工的平均值,以其标准差标准化。估计值是针对两个不同的样本进行的:高于基线员工人数中位数(8)的机构(面板 A)和低于基线员工人数中位数的机构(面板 B)。每个因变量有两个回归。在 Col 的(2)、(4)和(6)中,Webb(2020)的软件暴露指标被用作协变量。包括公司固定效应在内的规范中的观测值数量较少,是由于省略了单一机构。面板 B 中包括公司固定效应在内的规范中的观测值数量较少,这是因为较小的公司往往是单一企业。标准误差集中在公司层面。* p<0.1;** p<0.05;*** p<0.01。
我们利用机构层面的空缺职位数据研究人工智能对劳动力市场的影响,这些数据包含详细的职业和技能信息,包括 2010 年以来美国几乎所有的在线空缺职位。当机构员工从事与当前人工智能能力兼容的任务时,我们将机构归类为“人工智能暴露”。我们记录了 2010-2018 年人工智能相关空缺职位的快速增长,这种增长不仅限于专业和商业服务以及信息技术部门,而且在人工智能暴露的机构中增长更为显著。这些人工智能暴露的机构还会以差异化的方式消除列出一系列先前发布的技能的空缺职位,同时发布先前未列出的技能要求。机构层面的估计表明,人工智能暴露的机构正在减少非人工智能职位的招聘。然而,我们发现人工智能的暴露与职业或行业层面的就业或工资增长之间没有明显的关系,这意味着人工智能目前正在部分任务中取代人类,但尚未对总体劳动力市场产生可察觉的影响。关键词:人工智能、取代、劳动力、工作、任务、技术、工资。JEL 分类:J23,O33。
近年来,人工智能得到了广泛的发展,并从多个角度改变了医疗保健行业:临床诊断、建议治疗和后续治疗。临床决策支持 (CDS) 是医学领域人工智能的一个主要课题,用于协助临床医生进行护理。用于处理健康数据的现有技术大致可分为两类:(a) 非人工智能 (AI) 系统和 (b) 人工智能系统。尽管非人工智能技术本质上不太复杂,但大多数系统都存在不准确和缺乏收敛性的缺点。因此,这些系统通常被基于人工智能的系统所取代,这些系统比传统系统优越得多。人工智能技术大多是混合型的,包括人工神经网络 (ANN)、模糊理论和进化算法。AI 提高了医疗保健专业人员更好地了解他们所照顾的人的日常模式和需求的能力,有了这种了解,他们就能够提供更好的反馈、指导和支持,以保持健康。基于 AI 的 CDS 使用推理和逻辑,而非基于 AI 的 CDS 则依靠机器学习来执行相同的功能。CDS 可以协助完成许多临床任务,但必须将 CDS 正确集成到临床工作流程和健康记录中。CDS 可用于通过使用计算机辅助诊断 (CAD) 来帮助临床医生解释医学图片。CAD 结合了 AI 以及计算机视觉、信号处理和其他与医学相关的组件。乳腺癌、肺癌、结肠癌、冠状动脉疾病和阿尔茨海默病只是可以从 CAD 中受益的几种疾病。社会对人工智能在医疗保健领域的不断扩大使用存在一些担忧,包括可能存在的偏见、某些人工智能算法缺乏透明度、用于人工智能模型训练的数据的隐私问题以及临床环境中的安全和实施责任。本期特刊涵盖了健康信息学、生物医学信息学和医学图像分析领域的所有人工智能 (AI) 领域。根据评论,从提交给本期特刊的总共 15 篇论文中选出了 8 篇论文。每篇论文至少需要两名审稿人和至少两轮审查。下面列出了一些对本次讨论做出重要贡献的论文。) 在本期特刊的第一篇论文中描述了他们的发现。作者 (Alashwal 等人) 使用来自阿尔茨海默病神经影像学计划 (ADNI) 的数据以及三年的独立潜在类别分析 (LCA 和 LTA) 和潜在转换分析 (LTA)。研究人员发现,在定义和识别疾病时,LCA 比神经心理学检查中的典型临床截止指标更能预测 AD 进展。
我们研究了人工智能对劳动力市场的影响,使用了机构层面的空缺职位数据,其中包含了 2010 年以来美国几乎所有的在线空缺职位的详细职业信息。当机构员工从事的任务与当前人工智能能力兼容时,我们将机构归类为“人工智能暴露”。我们记录了 2010 年至 2018 年人工智能相关空缺职位的快速增长,这种增长不仅限于专业和商业服务以及信息技术部门,而且在人工智能暴露的机构中增长更为显著。人工智能暴露的机构正在以不同的方式取消列出一系列先前发布的技能的空缺职位,同时发布之前未列出的技能要求。机构层面的估计表明,人工智能暴露的机构正在减少非人工智能职位的招聘,同时扩大人工智能招聘。然而,我们发现人工智能暴露对职业或行业层面的就业或工资没有明显影响,这意味着人工智能目前正在部分任务中取代人类,但尚未对总体劳动力市场产生可察觉的影响。
我们调查了欧洲最大的在线劳动力市场 (OLM) 之一的三个替代但互补的市场力量指标:(1) 劳动力需求弹性、(2) 劳动力供应弹性和 (3) 市场份额集中度。我们探讨了这些指标与平台政策的外生变化之间的关系。在观察期的中期,平台强制雇主表明他们愿意支付的费率,该费率由执行项目所需的经验水平决定:入门级、中级或专家级。我们发现正的劳动力供应弹性介于 0.06 和 0.15 之间,对于专家级项目来说更高。我们还发现,政策变化后,劳动力需求弹性增加,而劳动力供应弹性下降。基于此,我们认为市场设计平台提供商可以通过为平台设定的条款和条件来影响 OLM 的劳动力需求和供应弹性。我们还探讨了所研究的 OLM 对人工智能相关劳动力的需求和供应。我们提供证据表明,与其他类型的劳动力相比,对人工智能相关劳动力的需求明显更高(从 +1.4% 到 +4.1% 不等),而对人工智能相关劳动力的供应明显更低(从 -6.8% 到 -1.6% 不等)。我们还发现,人工智能项目工人的工资比非人工智能项目工人高 3.0% 到 3.2%。
软件系统日益复杂,开发周期不断加快,对管理代码错误和实施业务逻辑提出了重大挑战。传统技术虽然是软件质量保证的基石,但在处理复杂的业务逻辑和广泛的代码库方面却存在局限性。为了应对这些挑战,我们引入了智能代码分析代理 (ICAA),这是一个结合了人工智能模型、工程流程设计和传统非人工智能组件的新概念。ICAA 利用 GPT-3 或 GPT-4 等大型语言模型 (LLM) 的功能来自动检测和诊断代码错误和业务逻辑不一致。在对这一概念的探索中,我们观察到错误检测准确率有了显着提高,将误报率从基线的 85% 降低到 66%,召回率有望达到 60.8%。然而,与 LLM 相关的代币消耗成本,尤其是分析每行代码的平均成本,仍然是广泛采用的重要考虑因素。尽管面临这一挑战,但我们的研究结果表明,ICAA 具有巨大的潜力,可以彻底改变软件质量保证,显著提高软件开发过程中错误检测的效率和准确性。我们希望这项开创性的工作能够激发该领域的进一步研究和创新,重点是完善 ICAA 概念并探索降低相关成本的方法。
• 任何个人数据处理的性质、范围、背景和目的,以及个人是否可能期望此类处理活动。 • 计划的处理有哪些替代方案(人工智能和非人工智能),选择这种方法的理由是什么,以及这种方法如何公平。 • 明确指出人工智能处理和自动化决策可能对个人产生影响的地方。 • 考虑个人和分配危害(例如,如果危害是由不允许学生在 GCSE 或 A Level 上选修某门科目决定造成的)和代表性危害(例如,选择一组学生进行不同的干预会导致性别或种族偏见)。 • 通过评估对个人权利和自由的益处与风险,以及/或是否有可能采取保障措施,确定人工智能工具的使用如何是相称和公平的。 • 分析任何可能对个人造成损害的算法偏见或不准确性。 • 如果使用人工智能取代人工干预,则需要对人类和算法的准确性进行比较,以证明在 DPIA 中使用人工智能工具的合理性。 • 如果做出自动化决策,个人将如何获知此信息以及他们如何挑战这些决策。 • 系统性能的相关变化或误差幅度,这可能会影响处理的公平性(包括统计准确性),并描述决策过程是否/何时有人参与。 • 任何安全威胁的潜在影响。 • 与利益相关者已完成或计划进行的磋商的摘要。除非有充分理由不进行这些磋商,否则建议进行这些磋商。咨询您处理其数据的个人可能是合适的,因为他们是重要的利益相关者。 • 处理是有意还是无意地处理特殊类别数据——在许多情况下,会处理非特殊类别数据,但推断出特殊类别数据(例如,邮政编码推断出特定种族)。 • 考虑个人的一般权利和自由,而不仅仅是在数据保护背景下,例如《2010 年平等法案》规定的权利。
人工智能 (AI) 越来越多地应用于利用信息技术的所有领域,预计将成为主要的经济驱动力之一。这种趋势的结果是,某些应用可能会在未来几年引发社会挑战。人工智能 (AI) 系统有可能在农业、交通、金融科技、教育、能源、医疗保健和制造业等领域创造渐进式变化并实现新的性能和能力水平。然而,与缺乏可信度相关的潜在风险可能会影响 AI 的实施及其接受度。AI 应用可以涉及并影响许多利益相关者,包括个人、组织和整个社会。AI 应用的影响可能会随着时间的推移而演变,在某些情况下,这是由于基础数据或法律环境的性质造成的。利益相关者应了解他们在参与中的角色和责任。AI 可能会带来巨大的风险和不确定性。专业人士、研究人员、监管者和个人需要意识到与人工智能系统和应用相关的伦理和社会问题。人工智能中潜在的伦理问题范围很广。人工智能中的伦理和社会问题的例子包括隐私和安全漏洞、歧视性结果以及对人类自主权的影响。伦理和社会问题的来源包括但不限于: — 未经授权的收集、处理或披露个人数据的手段或措施; — 采购和使用有偏见、不准确或不具代表性的训练数据; — 不透明的机器学习 (ML) 决策或文档不足,通常称为缺乏可解释性; — 缺乏可追溯性; — 对技术部署后的社会影响的理解不足。人工智能可能会不公平地运行,尤其是在使用有偏见或不适当的数据进行训练或模型或算法不适合用途的情况下。算法中蕴含的价值观以及人工智能系统和应用程序所要解决的问题的选择,可能会有意或无意地受到开发人员和利益相关者自己的世界观和认知偏见的影响。本文档包含基于通用框架的人工智能应用指南,以提供多种宏观视角。它还融合了人工智能特性和非功能性特性,例如可信度和风险管理。。标准开发人员、应用程序开发人员和其他相关方可以使用该指南。由于人工智能应用程序因其不断发展的性质和可信度方面而与非人工智能软件应用程序不同,因此所有利益相关者都应了解人工智能的特定特征。
牙科入学测试计划的开发始于1945年。当时,美国有39所认可的牙科学校,并招募了12,000名学生。当时已知,开发牙齿能力测试电池的基本原因有三个。一个是牙科学校四年来学生流失率的高率。估计,毕业前,全国一年级的20%至25%从牙科学校退出。可以预期,招生委员会在选择新生时使用的能力测试数据将减少由于奖学金不佳而撤离的学生人数。制定测试计划的另一个原因是,第二次世界大战的退伍军人开始大量申请牙科学校,而学校担心的是在与非退伍军人最新记录的教育记录中进行比较的前景。人们认为,通过使用教育记录和最近的考试成绩,可以更准确地评估退伍军人。这导致开发测试程序的第三个原因。牙科学校的录取官知道,各种高中和大学的成绩在教育成就方面具有不同的含义,并且人们认为,通过使用国家测试,可以使用常见的Yardstick来比较学生的成就。委员会还对衡量学生的兴趣,个性,毅力和社会本能的可能性感兴趣。在1945年,开发牙齿能力测试电池的委员会正在考虑衡量学生阅读和理解,记住言语和视觉材料的能力,以识别言语含义,推理,可视化模式,口头表达信息,表达手动敏捷性。归功于该委员会的信用,当测试电池确定性时,该清单大大降低了。牙齿能力测试电池是作为一种工具来衡量数学,口头推理,科学的阅读理解以及自然科学的学术成就的工具。委员会还包括对象可视化和粉笔雕刻的测试。除了一些例外,多年来,测试程序中给出的测试类型保持一致。在1972年,在天然科学的调查中添加了有机化学测试,并被感知运动能力测试取代了粉笔雕刻测试。在1972年之前,粉笔雕刻测试和空间关系测试提供了与手动敏捷性有关的信息,以及在三个维度上可视化的能力。出于各种原因,包括在全国范围内进行手动测试的困难和成本,粉笔雕刻测试被感知运动能力测试取代。验证研究(Graham,1972,1974)比较粉笔雕刻测试分数以及纸和铅笔感知能力测试评分与牙科学校的表现,这表明纸张和铅笔测试得分在预测性能中与粉笔雕刻测试一样有效。在开发感知运动能力测试时,确定了四个原则。简而言之,测试必须为:1)适用于小组给药,2)基于非人工绩效的3)高可靠性且不受实践效果的影响,以及4)能够区分技术和非技术水平的能力测量。允许通过感知运动能力测试更换粉笔雕刻试验的潜在因子是,当通过铅笔和纸测试可靠地对视觉感知进行可靠测量时,将是有效的预测指标,以判断在牙科课程中所需的技术课程成功的可能性。