ACT 认可并致力于遵守《教育与心理测试标准》(AERA、APA 和 NCME,2014 年)。ACT 还认可《教育公平测试实践准则》(联合测试实践委员会,2004 年),该准则规定了开发、管理或使用教育测试和测试数据的人员在以下四个方面对考生的义务:开发和选择合适的测试、管理和评分测试、报告和解释测试结果以及通知考生。ACT 认可并致力于遵守《教育测量专业责任准则》(NCME 道德规范制定特设委员会,1995 年),该准则规定了参与评估各个方面(包括开发、营销、解释和使用)的人员的专业责任。
得益于美国国家标准与技术研究所 (NIST)、美国教育部、经济合作与发展组织 (OECD)、欧盟委员会和联合国教育、科学及文化组织 (UNESCO) 等组织的努力,人们对负责任地使用人工智能的含义已经达成了普遍共识。美国心理学会 (APA)、美国教育研究协会 (AERA)、美国国家教育测量委员会 (NCME) 和国际测试委员会 (ITC) 制定的联合标准也为教育测量的道德方法提供了重要指导。
ETS 不会为 ParaPro 评估设定合格(通过)分数。选择使用评估来评估辅助专业人员资格的每个机构(州、学区或其他机构)都负责确定自己的合格(通过)分数。ETS 愿意与机构合作,按照推荐的专业实践开展通过分数研究,例如,如由 AERA、APA 和 NCME 联合制定的 ETS 质量和公平标准以及教育和心理测试标准中所述。ETS 与使用 ParaPro 评估的机构达成的协议是,评估分数不是机构做出决定的唯一标准。要查看使用 ParaPro 评估及其通过分数的最新州和学区列表,请访问:http://www.ets.org/parapro/state_requirements/ 。
我们邀请公众就 Duolingo 英语测试负责任的 AI 标准发表评论。我们制定这些标准是为了推动评估领域关于 AI 测试道德使用的思考。因此,我们的标准参考了 AERA/APA/NCME 标准、ITC-ATP 技术评估指南以及 AI 伦理学术文献。利用行业指南和 AI 伦理,并参与多方利益相关者合作,帮助我们制定了负责任的 AI 标准。我们的标准有助于提高 Duolingo 英语测试的有效性、可靠性、公平性和安全性。Duolingo 英语测试评估研究团队由应用语言学、计算心理测量学、语言评估、机器学习和统计学专家组成,他们与 Duolingo 法律和安全团队的专家以及来自计算机科学领域的独立外部负责任 AI 专家合作制定了这些标准。Duolingo 英语测试负责任的 AI 标准旨在成为一份动态文件。我们相信,通过与受 AI 影响的社区利益相关者进行公开参与,这些标准将促进将 AI 用于善举的目标。