摘要 人工智能 (AI) 在教育测量中的整合改变了评估方法,允许通过机器学习和自然语言处理实现自动评分、快速内容分析和个性化反馈。这些进步为学生表现提供了宝贵的见解,同时也增强了整体评估体验。然而,人工智能在教育中的实施也引发了有关有效性、可靠性、透明度、公平性和公正性的重大伦理问题。算法偏见和人工智能决策过程的不透明性等问题有可能加剧不平等并影响评估结果。作为回应,包括教育工作者、政策制定者和测试组织在内的各种利益相关者已经制定了指导方针,以确保人工智能在教育中的合乎道德的使用。美国国家教育测量委员会的人工智能测量和教育特别兴趣小组 (AIME) 致力于建立道德标准并推进该领域的研究。在本文中,来自不同领域的 AIME 成员研究了人工智能工具在教育测量中的伦理影响,探讨了自动化偏见和环境影响等重大挑战,并提出了确保人工智能在教育中负责任和有效使用的解决方案。