COVID-19(2019 冠状病毒病)疫情对社会产生了重大影响,这既是因为 COVID-19 对健康的严重影响,也是因为为减缓其传播而实施的公共卫生措施。其中许多困难从根本上来说都是信息需求;解决这些需求的尝试导致研究人员和公众都面临信息过载。自然语言处理 (NLP) 是人工智能的一个分支,可以解释人类语言,可用于解决 COVID-19 疫情带来的许多紧迫信息需求。本综述调查了大约 150 项 NLP 研究和 50 多个针对 COVID-19 疫情的系统和数据集。我们详细介绍了四个核心 NLP 任务的工作:信息检索、命名实体识别、基于文献的发现和问答。我们还描述了通过四个额外任务直接解决疫情各个方面的工作:主题建模、情绪和情感分析、案例量预测和错误信息检测。最后,我们讨论了可观察到的趋势和剩余的挑战。
全科医生是文本电子健康记录的主要用户和管理者之一,这凸显了对支持记录访问和管理的技术的需求。自然语言处理的最新进展促进了临床系统的发展,使一些耗时的记录保存任务自动化。但是,目前尚不清楚哪些自动化任务最有利于临床医生,这种自动化应该具备哪些功能,以及临床医生将如何与自动化进行交互。我们对全科医生进行了半结构化访谈,了解他们对文本自动化的看法和态度。新兴的主要主题是医生与人工智能的合作,解决了互惠的临床医生与技术关系,这种关系不会威胁到临床医生的替代,而是建立了建设性的协同关系。其他主题包括:(i)临床文本自动化的期望功能;(ii)对临床文本自动化的担忧;(iii)未来的咨询。我们的研究结果将为未来自然语言处理系统的设计提供参考,并在一般实践中实施。
背景:中风的患者的康复需要精确的个性化治疗计划。自然语言处理(NLP)提供了从临床笔记中提取有价值的锻炼信息的潜力,有助于制定更有效的康复策略。目的:本研究旨在开发和评估各种NLP算法,以从匹兹堡医学中心接受中风的患者的临床注释中提取和分类体育康复运动信息。方法:确定了13,605例被诊断为中风的患者的队列,并检索了含有康复治疗笔记的临床笔记。创建了一个全面的临床本体论,以代表身体康复运动的各个方面。最新的NLP算法,包括基于规则的基于机器学习的算法(支持向量机器,逻辑回归,梯度增强和ADABOOST)和大型语言模型(LLM)基于基于基于的算法(LLM)算法(CANTGPT [openai])。这项研究的重点是关键性能指标,尤其是F 1分钟,以评估算法有效性。结果:对包含23,724个注释的数据集进行了分析,并具有详细的人口统计学和临床特征。基于规则的NLP算法在大多数领域都表现出卓越的性能,尤其是在检测F 1秒为0.975的“右侧”位置时,表现优于0.063的梯度提升。梯度提升在“下肢”位置检测中表现出色(F 1 -SCORE:0.978),基于规则的NLP超过0.023。它在“被动运动范围”检测中还显示出显着的性能,F 1次0.970,比基于规则的NLP提高0.032。基于规则的算法有效地处理了“持续时间”,“ sets”和“ reps”,f 1得分高达0.65。基于LLM的NLP,尤其是少量提示的Chatgpt,获得了很高的召回率,但通常较低的精度和F 1分。然而,在“向后平面”运动检测中,它表现出色,达到0.846的F 1次,超过了基于规则的算法的0.720。
此预印本版的版权持有人于2024年12月17日发布。 https://doi.org/10.1101/2024.12.16.628764 doi:biorxiv Preprint
数据集特征:受试者的数量,访问总数和积极访问的数量。数据集的4个版本的详细信息是独立报告的,同时还考虑了培训/验证/测试子集拆分。在最后一列的圆括号中报告了正访问的频率。
语境会影响理解者在语言处理过程中的期望,信息论惊奇通常被用作衡量认知处理努力的指标。然而,先前使用惊奇的研究只考虑了句内语境,使用 n-gram、神经语言模型或句法结构作为条件语境。在本文中,我们扩展了惊奇方法以使用更广泛的主题语境,通过分析自然聆听过程中收集的 fMRI 时间过程来研究局部和主题语境对处理的影响。从 ngram 和 LSTM 语言模型计算出的词汇惊奇可用于捕捉局部语境的影响;为了捕捉更广泛语境的影响,我们引入了一个基于主题模型的新指标——主题惊奇。我们确定了词汇惊奇和主题惊奇的不同神经激活模式。这些不同的神经解剖学相关性表明,句子处理过程中的局部和广泛的语境线索会调动不同的大脑区域,并且语言网络的这些区域在功能上有助于在理解过程中处理不同维度的语境信息。更广泛地说,我们的方法补充了越来越多的使用计算语言学方法的文献,以操作和测试有关句子处理中的神经认知机制的假设。
惊讶与惶恐:基于人工智能的自然语言生成对写作教学的影响 Chris M. Anson 美国北卡罗来纳州立大学 Ingerid S. Straume 挪威奥斯陆大学 摘要 基于人工智能的自然语言生成系统目前能够在极少的人为干预下生成独特的文本。 由于这类系统的改进速度非常快,如果教师期望学生自己写作——参与产生和组织想法、研究主题、起草连贯的文章,并利用反馈进行原则性修改等复杂过程,这些修改既能提高文本质量,又能帮助他们成长为作家——那么他们将面临这样的前景:学生可以使用这些系统生成看起来像人类的文本,而无需参与这些过程。 在本文中,我们首先描述基于人工智能的自然语言生成系统(如 GPT-3)的性质和功能,然后就教师如何应对系统日益改进及其对学生的可用性所带来的挑战提出一些建议。简介 教育工作者长期以来一直担心新技术的进步会颠覆学生的学习过程——这种担忧在电子计算器出现后的几十年里一直存在于数学教师中(见 Banks,2011)。互联网的出现首先引发了学生对资料来源使用的偏执,因为只需点击几下鼠标,就可以获得大量信息,而且复制粘贴成为学生在不注明出处的情况下将他人的文字拼接到自己的文章中的一种简单方法。文本可以在屏幕上进行操作以达到所需的长度(例如,通过不知不觉地增加逗号和句号的字体大小或更改字符宽度)。精通技术的学生很快就能通过用系统无法识别的西里尔字体替换看起来相同的字母、在行末添加不可见的单词(白色字体)或添加虚构的参考资料来欺骗抄袭检测工具。手机使人们能够通过发短信、存储信息或在线搜索在课堂考试中作弊。论文写作服务在互联网上蓬勃发展。与此同时,更复杂的翻译程序继续困扰着外语教师和那些与 L2 学生一起工作的人(Karbach,2020 年)。然而,与基于人工智能的语言生成技术的潜力相比,这些偷偷摸摸的逃避将显得微不足道:系统可以自动生成与人类书写完全或几乎完全一样的文字。这种下一代自然语言处理技术为写作教育者提出了关键问题。在本文中,我们首先简要描述了 GPT-3 等能够生成、总结、组织和翻译自然语言文本的人工智能系统的发展,并提供了一些这些系统功能的示例,既有帮助又令人不安。然后,我们讨论这些系统对学术写作教学的影响,在这些系统中,它们将越来越普及,并可供学生使用。
抽象自然语言处理(NLP)已成为医疗文献的变革性技术,解决了数据复杂性,互操作性和记录保存错误等挑战。本文探讨了NLP的基本原理,其在医疗保健中的应用以及其在自动化和提高临床文档准确性中的作用。关键重点领域包括提取非结构化数据,实时转录和情感分析,以及对维持患者机密性至关重要的道德和隐私注意事项。尽管有预算限制和系统互操作性等挑战,但NLP医疗保健中NLP的未来仍然对个性化医学,预测分析和实时决策有望。通过NLP的进步,医疗保健提供者可以在确保道德合规性的同时解锁宝贵的见解并优化患者护理。关键字:自然语言处理(NLP),医疗文献,临床数据,医疗保健技术,患者隐私,道德考虑因素。
资金/支持:Falcone 博士获得了 NIH(拨款编号 K76AG059992 和 R03NS112859)、AHA(拨款编号 18IDDG34280056 和 817874)、神经重症监护协会研究奖学金和一项试点拨款的支持。Payabvash 博士获得了 NIH(拨款编号 K23NS118056)、Doris Duke 慈善基金会(拨款编号 2020097)和美国神经放射学会基金会的拨款支持。Struck 博士获得了 NIH(拨款编号 R01NS111022、R01NS117568 和 R01NS120976)和 Lily 基金会(ACH 15170)的资助。 Sheth 博士得到了美国国立卫生研究院国家神经疾病和中风研究所(拨款编号 U01NS106513、R01NS11072、R01NR018335、R03NS112859、U24NS107215 和 U24NS107136)、美国心脏协会(拨款编号 17CSA33550004)和
摘要:人工智能 (AI) 和自然语言处理 (NLP) 是医疗保健领域不可或缺的技术,它们可以支持强大且安全的数字系统,并嵌入物联网 (IoT) 应用。本研究试图构建一个人工智能-自然语言处理集群系统。在该系统中,使用词性提取丰富的内容,然后将其分类为可理解的数据集。无法使用具有标准化流程和程序的独特系统来跨不同系统支持电子医疗保健部门,这对各国乃至全世界都是一个巨大的挑战。旨在训练一个集群系统,该系统可以提取丰富的内容并适应深度学习模型框架,以便通过快速安全的数字系统解释医疗保健需求的数据集。本研究使用(行为导向驱动和影响函数)来确定 AI 和 NLP 对电子健康的重要性。基于选择性评分方法,开发了 5 分制中的 1 分率,称为关键优势分数。行为导向驱动和影响函数允许根据应用于样本研究的文本内容选择对电子健康进行深入评估。结果显示,NLP 和 AI 在电子医疗领域的规模显著性得分为 3.947。研究得出结论,定义明确的人工智能和自然语言处理应用是推动医疗电子服务取得积极成果的完美领域。