点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
拼字法变化在勒克斯灌输文本中非常普遍,因为缺乏完全属于的标准品种。此外,考虑到缺乏带注释的和par的数据,卢森堡的开发NLP工具是一项困难的任务,这会因持续的标准化而加剧。在本文中,我们使用BYT5和MT5体系结构提出了第一个序列到序列的归一化模块,并使用从文字级别的实现生活变化数据获得的训练数据。我们执行一种细粒度的,语言动机的评估,以测试基于字节的基于单词的基于单词和管道模型,以实现其在文本中的优势和劣势。我们表明,使用现实生活变化数据的序列模型是量身定制勒克斯艘施加规范化的有效AP。
主要关键词