Loading...
机构名称:
¥ 1.0

在Natu的语言任务中已经取得了重大进步,这在很大程度上归因于强大的大型语言模式(LLMS)的出现。这些模型已在充分和多样化的语料库中进行了预先培训,已经具有不可思议的能力理解语言的文化。尽管LLM大量用于许多高资源语言,但此类模型的可用性仍然是欧洲葡萄牙语的限制性。我们介绍了强大的欧洲葡萄牙解码器LLMGlória。为了预训练Glória,我们组装了一个全面的PT-PT文本语料库,其中包括来自各种来源的350亿个令牌。我们介绍了我们的训练方法,然后评估模型对多个下游任务的有效性。补充,为了评估我们的模型的语言模型功能,我们介绍了calame-pt(葡萄牙语的上下文意识语言建模评估),这是第一个葡萄牙零射击语言模型基准。评估表明,Glória在语言建模中显着超过现有的PT解码器模型,并且可以生成声音,知识丰富和相干的PT-PT文本。该模型还具有各种下游任务的强大潜力。1

Glória:葡萄牙语的生成且开放的大语言模型

Glória:葡萄牙语的生成且开放的大语言模型PDF文件第1页

Glória:葡萄牙语的生成且开放的大语言模型PDF文件第2页

Glória:葡萄牙语的生成且开放的大语言模型PDF文件第3页

Glória:葡萄牙语的生成且开放的大语言模型PDF文件第4页

Glória:葡萄牙语的生成且开放的大语言模型PDF文件第5页

相关文件推荐

2025 年
¥2.0
1900 年
¥4.0
2024 年
¥13.0
1900 年
¥12.0
2024 年
¥13.0