点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
包括来自克罗地亚,波斯尼亚语和塞尔维亚语言的文本,这些文本可以由于语言相似性而改善模型的性能。以英语模型为起点提出了模型词汇的问题,因为现有的模型不适合Slovene,从而导致Slovene文本的效率低下(即与有效的令牌化相比,产生的令牌大大增加了)。为了解决这个问题,我们训练一个新的令牌机并采用嵌入初始化方法Wechsel(Minixhofer等,2022)和Focus(Dobler&de Melo,2023)来转移嵌入
主要关键词