获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
特定于领域的命名实体识别(NER)的意义,尤其是在法律和医学等领域,要求进行更深入的研究和实现。NER在医疗NLP中的作用如下:首先,NER有助于处理医学术语。医学ner使语言模型能够识别和处理医疗术语和行话。接下来,它有助于从非结构化数据中提取信息。实际上,Pearson等。(2021)已经执行了NER来重新移动或从非结构化医疗数据集中编码信息。此外,NER有助于敏感的患者特定信息的匿名性(Catelli等人,2021)。但是,医疗数据集不足是有问题的。这个问题变得更加具有挑战性,因为特定领域的NER任务需要广泛的标签,尤其是对于疾病,身体和治疗等特定实体类别。由于需要专家级知识,因此难以进一步放大。数据稀缺问题在诸如韩文等相对低资源的语言中会恶化。没有开源医疗数据集的韩国人证明了问题的严重性。为了解决数据稀缺问题,我们介绍了KBMC(韩国生物医生),这是第一个针对韩国的开源医疗数据集。我们利用chatgpt 1进行有效的句子创建。随后,我们注释了与生物格式下的疾病名称,身体部位和治疗相对应的实体。增加数据集并检查一般文本中的性能,