详细内容或原文请订阅后点击阅览
欧盟资助 EDIA 在荷兰、德国和西班牙实现自动可读性评估的努力
准确、一致地检查文本可读性水平的能力对作者和教师至关重要。这将使他们能够创建和发现满足具有不同背景和技能水平的学生需求的内容。我们的项目旨在开发一套数据收集和注释工具,以促进数据集(语料库)的创建,这些数据集可用于开发分类。这些可以根据欧洲共同参考框架 (CEFR) 自动评估文本的阅读难度。
来源:EDIA博客为什么 CEFR 如此重要?
CEFR(欧洲语言共同参考框架:学习、教学和评估)旨在提供一种适用于所有欧洲语言的综合学习、教学和评估方法。CEFR 表明欧洲及其他地区外语学习者的水平,有助于评估一个人的语言能力。到目前为止,大多数人都熟悉用于此目的的六个参考级别(A1、A2、B1、B2、C1 和 C2)。
CEFR 级别是交流式(外语)语言习得、教学和认证方法的基础。尽管 CEFR 级别代表了一种得到广泛支持的方法,但标有 CEFR 级别的教育内容的可用性和质量有限。这是因为非常费力且容易出错的标记过程是手动执行的(除了某些例外情况)。这导致了出版、教学和学习方面的一些实际障碍:
- 内容创建者(出版商、作者和教师)难以使用一致的标准来检查文本的难度级别。学校和教师很难为学生找到和/或创建合适的文本。
内容创建者(出版商、作者和教师)难以使用一致的标准来检查文本的难度级别。
学校和教师很难为学生找到和/或创建合适的文本。
为了解决这个问题,我们开发了一种使用自然语言处理的自动文本分类技术。该技术可以在非常精细的级别上以可扩展、一致的方式对多种语言执行 CEFR 文本分级。
为了解决这个问题,我们开发了一种 自动文本分类技术