结果:我们开发了一种基于指导的学习范式,该范式将生物医学NER从序列标记任务转换为一代任务。此范式是端到端的,并通过自动重新利用先前存在的生物医学NER数据集来简化培训和评估过程。,我们使用拟议的范式将llama-7b作为基础LLM进一步开发了Bioner-lalama。我们对三个公认的生物医学数据集进行了对Bioner-lalama的广泛测试,该数据集由与疾病,化学物质和基因有关的实体组成。结果表明,与具有不同生物医学实体的数据集中的GPT-4相比,Bioner-lalama始终达到的F1得分范围从5%到30%。我们表明,通用域LLM可以与严格微调的PubMedbert模型和PMC-llama(生物医学特异性语言模型)相匹配。我们的发现强调了我们提出的范式在开发一般域LLM中的范式,这些范式可以与生物医学和健康应用中的多任务,多域中的SOTA表现相媲美。
主要关键词