摘要:在大数据时代,基于文本的医疗数据(如电子健康记录 (EHR) 和电子病历 (EMR))正在迅速增长。EHR 和 EMR 是从患者那里收集的,用于记录他们的基本信息、实验室检查、生命体征、临床笔记和报告。EHR 和 EMR 包含有用的信息,可帮助肿瘤学家进行计算机辅助诊断和决策。然而,医生从 EHR 和 EMR 数据中提取他们需要的有价值信息并分析这些信息非常耗时。最近,越来越多的研究工作将自然语言处理 (NLP) 技术(即基于规则、基于机器学习和基于深度学习的技术)应用于 EHR 和 EMR 数据,用于肿瘤学的计算机辅助诊断。本综述的目的是叙述性地回顾肿瘤学计算机辅助诊断的 NLP 应用领域的最新进展。此外,我们打算缩小人工智能 (AI) 专家和临床专家之间的研究差距,以设计更好的 NLP 应用程序。我们最初从 PubMed、Google Scholar 和 ACL Anthology 三个电子数据库中确定了 295 篇文章;然后,我们删除了重复的论文,并根据摘要内容手动筛选了不相关的论文;最后,经过文献综述的筛选过程,我们总共纳入了 23 篇文章。此外,我们进行了深入分析,并将这些研究分为七种癌症类型:乳腺癌、肺癌、肝癌、前列腺癌、胰腺癌、结直肠癌和脑肿瘤。此外,我们在本文中确定了 NLP 应用在支持临床实践方面的当前局限性,并提出了一些有希望的未来研究方向。
主要关键词