Opinion: The Remarkable Educational Attainment Gains of the School Reform Era
本文的一个版本最初出现在福特汉姆研究所的 Flypaper 博客上。如今,关于教育的全国性对话,就实际发生的程度而言,往往有两种方言。第一个涉及对大约 10 或 12 年前开始的学生成绩下降的适当担忧,[...]
Analyzing Dialectical Biases in LLMs for Knowledge and Reasoning Benchmarks
大型语言模型 (LLM) 在现代自然语言处理中无处不在。然而,之前的研究表明,代表性不足的英语方言的法学硕士成绩有所下降。我们分析了将“标准”美式英语问题典型化为非“标准”方言变体对多项选择题回答任务的影响,发现准确率降低了 20%。此外,我们还调查了非“标准”英语问题中表现不佳的语法基础。我们发现各个语法规则对性能有不同的影响,但有些更……