摘要 文本检索和语义分割的应用具有很大的潜力,可以改变法律研究行业的格局,使任何人都可以更轻松地获取和负担得起相关信息。在本工作论文中,我们介绍了一些新方法,作为人工智能法律援助 (2020) 的一部分,这是信息检索评估论坛-2020 的一个重要活动。在本文的第一部分,我们使用基于 BM 25、主题嵌入和 Law2Vec 嵌入的方法确定了所提供查询的相关先前案例和法规。对于第二部分,我们使用 BERT 将法律案件文件语义分割为七个预定义标签或“修辞角色”。在第一个任务中,我们在 P@10 和 BPREF 指标中的表现使我们位居前两名。另一方面,我们针对第二个任务的 BERT 实现获得了 .479 的宏精度,仅比表现最佳的方法低 .027。关键词 1 nlp、词嵌入、主题嵌入、bm25、先例检索、信息检索、法规检索、bert、修辞角色、分类、法律 1。介绍