收到日期:2024 年 12 月 4 日;修订日期:2024 年 12 月 28 日;接受日期:2024 年 1 月 10 日;发布日期:2024 年 1 月 29 日;摘要 - 神经符号人工智能 (NeSy AI) 代表了自然语言处理 (NLP) 领域的一种突破性方法,将神经网络的模式识别与符号人工智能的结构化推理相结合,以解决人类语言的复杂性。本研究调查了神经符号人工智能在提供细致入微的理解和上下文相关响应方面的有效性,其驱动力是克服现有模型在处理复杂语言任务和抽象推理方面的局限性。该研究采用将多模态上下文建模与规则控制的推理和记忆激活相结合的混合方法,深入研究命名实体识别 (NER) 等特定应用,其中 BiLSTM + CRF 等架构通过分析整个句子上下文表现出更高的准确性。研究结果肯定了神经符号人工智能在增强语言解析、语义歧义解析和整体语言理解能力方面的潜力。值得注意的是,这项研究展示了在改进 NER 任务方面取得的重大进展,突出了这种方法的实际意义和有效性。这项研究表明,神经符号人工智能的发展体现了人们不断追求在机器和人类语言之间创造更复杂、更准确、更像人类的交互,有望对医疗保健和教育等各个领域产生变革性影响。这些发现为人工智能的未来研究和发展铺平了道路,突破了技术在理解和与人类语言互动方面的作用的界限。
正是在这样的背景下,伊利诺伊州颁布了立法,成立了生成式人工智能和自然语言处理工作组 (20 ILCS 1370/1-80),目的是研究 GenAI 和自然语言处理 (NLP) 技术带来的机遇和挑战。工作组的任务是研究这些技术在多个关键领域的影响,并充当一个论坛,讨论这些技术对伊利诺伊州居民和机构的影响。工作组由教育工作者、网络安全专家、人工智能专家、商界领袖和政府官员组成,以混合形式举办了五次公开会议。这些会议以专家小组成员和讨论为特色,在芝加哥、斯普林菲尔德、大都会东区、四城和南伊利诺伊州举行。讨论的主题包括消费者保护、生成式人工智能在课堂上的使用、利用人工智能改善公共服务、维护公民自由、解决劳动力和环境影响以及加强网络安全。通过这些会议以及多个工作组的工作,工作组探索了 GenAI 在众多领域的当前和未来影响。
评分量表我不给予DS,ES和缺点。我给出的唯一成绩是,BS,CS和FS。没有化妆流行测验。没有接受家庭作业或定期项目的迟来。我只有在您作弊时就会给出一个F,错过了四个以上的流行测验,不要提交所有家庭作业,不要提交学期项目,不要参加并参加所有家庭作业比赛,不要参加所有术语项目演示文稿,并且不参加术语项目演示。家庭作业1的成绩基于计时试验中的班级排名。家庭作业2的成绩基于比赛阶梯的班级排名。根据我对团队所花费的努力的看法,该术语项目的成绩是主观的。整体成绩是计算出的混合物,占流行测验的10%,家庭作业的25%,占作业2的25%,占该学期项目的40%。请不要要求我提供推荐信,雇用您作为RA,或者根据本课程的成绩,甚至是根据您为本课程准备的“项目/演示”一词。您需要做其他区分您的事情,让我做这些事情。
de从蛋白质设计代表了蛋白质工程中的基本追求,但是当前的深度学习方法仍受其狭窄的设计范围的限制。在这里,我们提出了一个大规模的边界框架,其中包括160亿个参数,并接受了17亿个蛋白质文本对的训练,它将其与蛋白质设计空间相融合,将人类的意图转化为新的蛋白质序列。Pinal不是直接的端到端文本到序列生成,而是实现了一个两个阶段的过程:基于语言指令的首次生成蛋白质结构,然后设计以生成的结构和语言输入为条件的序列。该策略通过在更可牵引的结构域中运行有效地约束了搜索空间。通过全面的实验,我们证明,与现有方法相比,Pinal的性能优于同时工作ESM3,同时表现出对PDB数据库以外的新型蛋白质结构的强大概括。在线演示可在http://www.denovo-pinal.com/上获得。
摘要:自然语言处理(NLP)是一种将人类语言转化为机器可读数据的技术,正在革新许多领域,包括癌症护理。本综述概述了NLP的演变及其为癌症患者制定个性化治疗途径的潜力。利用NLP将非结构化医学数据转换为结构化的可学习格式的能力,研究人员可以利用大数据的临床和研究应用程序的潜力。NLP的重大进步激发了人们对开发工具的兴趣,这些工具可以自动从临床文本中提取信息,从而有可能改变放射肿瘤学的医学研究和临床实践。所讨论的应用包括症状和毒性监测,确定健康的社会决定因素,改善患者 - 物理学的沟通,患者教育和预测性建模。然而,一些挑战阻碍了NLP收益的全面实现,例如隐私和安全问题,NLP模型中的偏见以及这些模型的可解释性和一般性性。克服这些挑战需要计算机科学家与辐射肿瘤学社区之间的合作努力。本文是理解NLP算法的复杂性,其绩效评估,过去的研究贡献以及NLP的未来的综合指南。关键字:人工智能,个性化医学,放射疗法,自然语言处理
自然语言处理 (NLP) 是人工智能 (AI) 中的一个重要研究课题,因为它是不同科学和工业利益的目标。自然语言处于学习、知识表示和认知建模的交叉点。最近的几项人工智能成就已多次显示出它们对复杂推理任务的有益影响,在语言建模、处理和推理方面具有巨大的应用前景。然而,自然语言理解仍然是一个丰富的研究课题,其交叉融合涵盖了许多独立领域,例如认知计算、机器人技术以及人机交互。对于人工智能来说,自然语言是范式和应用的研究重点,但同时,它们也是从视觉到规划和社会行为等大多数智能现象的自动化、自主性和可学习性的基石。反思这种多样化且有前景的互动是当前人工智能研究的重要目标,完全符合 AI*IA 的核心使命。本次研讨会得到了 AI*IA NLP 特别兴趣小组 5 和意大利计算语言学协会 (AILC) 6 的支持,旨在广泛概述意大利人类语言技术 (HLT) 领域的最新活动。在此背景下,NL4AI 2021 的组织为研究人员提供了分享专注于多个领域的 NLP 的人工智能应用经验和见解的机会。2021 年版 NL4AI 与第 20 届意大利人工智能协会国际会议 (AIxIA 2021) 在同一地点举行,由于 COVID-19 大流行而在线举行。会议议程可在官方研讨会网站 7 上找到。征文活动共收到来自意大利(23)、德国(5)和法国(4)的 34 位作者的 12 篇投稿。经过审核,12 篇论文中有 10 篇被接受发表(接受率为 83%)。论文涉及
摘要 人工智能 (AI) 和自然语言处理 (NLP) 正在改变设计师处理和执行任务的方式,从根本上改变了各种设计学科的格局,包括工业、时尚、室内、界面和视觉传达设计。本研究探讨了生成式 AI 和 NLP 如何显著增强设计流程的创造力和功能性。目标是研究和开发 AI 和 NLP 在设计中的应用,评估这些技术与现有工作流程的集成,并解决可持续创新所必需的道德考虑。通过研究 AI 和 NLP 在设计中的交集,本研究旨在开发一个集成这些技术的系统,以促进设计师的创作过程并建立实用指南。
摘要 简介 缺乏有效、一致、可重复和高效的哮喘确定方法,导致临床试验或其他研究的哮喘队列和研究结果不一致。我们旨在评估将基于专家人工智能 (AI) 的自然语言处理 (NLP) 算法应用于儿科人群的电子健康记录中的两种现有哮喘标准是否能够系统地识别具有独特特征的儿童哮喘及其亚群。方法 使用 1997-2007 年 Olmsted 县出生队列,我们将经过验证的 NLP 算法应用于预定哮喘标准 (NLP-PAC) 以及哮喘预测指数 (NLP-API)。我们将受试者分为四组(两项标准均为阳性 (NLP-PAC + / NLP-API + );仅 PAC 阳性 (仅 NLP-PAC +);仅 API 阳性 (仅 NLP-API +);和两项标准均为阴性 (NLP- PAC − /NLP-API − ))并对其进行了表征。使用实验室和肺功能测试 (PFT) 对哮喘患者和 300 名儿童的随机样本进行无监督聚类分析,结果得到了复制。结果 在 8196 名受试者(51% 为男性,80% 为白人)中,我们确定了 1614 名(20%)为 NLP-PAC + /NLP-API +;954 名(12%)为 NLP-PAC +;105 名(1%)为 NLP-API +;和 5523 名(67%)为 NLP-PAC − /NLP-API −。与其他组相比,被归类为 NLP-PAC + /NLP-API + 的哮喘儿童哮喘发作更早、Th2 特征更明显、肺功能更差、哮喘发作率更高、哮喘相关合并症风险更高。这些结果与基于无监督聚类分析以及随机样本研究对象的实验室和 PFT 数据的结果一致。结论 针对两种哮喘标准的专家 AI NLP 算法系统地识别了具有独特特征的儿童哮喘。这种方法可以提高哮喘大规模临床研究的精确度、可重复性、一致性和效率,并实现人群管理。
我们引入了 N ATURAL P LAN ,这是一个自然语言中的现实规划基准,包含 3 个关键任务:旅行规划、会议规划和日历安排。我们将评估重点放在 LLM 的规划能力上,并提供关于任务的完整信息,方法是将 Google 航班、Google 地图和 Google 日历等工具的输出作为模型的上下文。这样就无需使用工具使用环境来评估规划上的 LLM。我们观察到 N ATURAL P LAN 是针对最先进模型的具有挑战性的基准。例如,在旅行规划中,GPT-4 和 Gemini 1.5 Pro 分别只能实现 31.1% 和 34.8% 的解决率。我们发现,随着问题复杂性的增加,模型性能急剧下降:当有 10 个城市时,所有模型的性能都低于 5%,这凸显了 SoTA LLM 在自然语言规划方面存在巨大差距。我们还对 N ATURAL P LAN 进行了广泛的消融研究,以进一步阐明自我校正、少量泛化和具有长上下文的上下文规划等方法对改进 LLM 规划的 (不) 有效性。
在输入端,semantha ® 必须先读取文档并将其传输到内部数据结构中。如果数据以半结构化形式提供,例如在 Word 文档中,semantha ® 会使用现有文档结构,例如按标题划分章节。如果输入数据以不太结构化的形式提供,例如在 PDF 文档中,semantha ® 不仅会访问文本内容,还会访问视觉属性(元素 Ir - 图像识别)。例如,必须单独识别和评估表格,或者必须跳过插图以及页眉和页脚中的文本(即不分配给连续文本);同时,文本的视觉属性用于得出有关扩展文档结构的结论(例如识别标题和旁注)。这种准备是必要的,因为现实世界的用例不仅限于“技术上美观”的文件格式。结构化文件格式,如 XML 方言,也可以用作数据格式。