摘要。在过去的几年中,歧视性和生成性的大语言模型(LLM)已成为自然语言处理的主要方法。,尽管取得了重大进步,但在比较跨语性生物医学概念归一化中判别和生成性LLM的性能仍然存在差距。在本文中,我们对几个LLM进行了比较研究,涉及跨语言生物医学概念通过致密检索的具有挑战性的任务。我们利用涵盖10种语言的XL-BEL数据集来评估模型在不进一步适应的情况下在各种语言环境中概括的能力。实验发现表明,E5是一种判别模型,表现出卓越的性能,而生物分类出现为表现最佳的生成LLM。复制实验的代码可在以下网址提供:https://github.com/hrouhizadeh/zsh_cl_bcn。