详细内容或原文请订阅后点击阅览
从 NLx 语料库中提取 O*NET 特征以构建公共使用的劳动力市场总体数据
作者:Stephen Meisenbacher,慕尼黑工业大学Svetlozar Nestorov,芝加哥洛约拉大学Peter Norlander,芝加哥洛约拉大学 摘要:在线职位发布的数据很难访问,并且不是以标准或透明的方式构建的。标准分类和职业信息数据库(O*NET)中包含的数据很少更新,并且基于小调查样本。我们[…]帖子从 NLx 语料库中提取 O*NET 特征以构建公共使用的劳动力市场总体数据首先出现在公平增长上。
来源:华盛顿公平增长中心信息作者:洛约拉大学芝加哥洛约拉大学芝加哥洛约拉大学芝加哥洛约拉大学慕尼黑大学慕尼黑大学慕尼黑大学诺伊斯特洛萨尔·内斯托罗夫史蒂芬·梅森巴赫
Stephen Meisenbacher Svetlozar Nestorov 彼得·诺兰德摘要:
在线工作发布的数据很难访问,并且不是以标准或透明的方式构建的。标准分类法和职业信息数据库(O*NET)中包含的数据很少,并且基于小型调查样本。我们采用o*网络作为构建自然语言处理工具的框架,从工作发布中提取结构化信息。我们发布了为此目的构建的开源工具的工作广告分析工具包(JAAT),并在样本外和法官AS-As-Gudge测试中证明了其可靠性和准确性。我们从国家劳动交易所(NLX)研究中心提供的超过1.55亿个在线工作广告中提取超过100亿个数据点,包括O*净任务,职业代码,工具和技术,以及工资,技能,行业和更多功能。我们描述了从2015 - 2025年每月活跃的工作汇总的职业,州和行业层面功能数据集的构建。我们说明了教育和劳动力发展中研究和未来用途的潜力。
