摘要。在过去的十年中,美国的电子健康记录(EHR)数据数量激增,归因于《 2009年健康信息技术经济和临床健康法》(HITECH)2009年的有利政策环境和2016年21世纪治疗法案。医生在自由形式的文本中捕获了患者评估,诊断和治疗的临床笔记,他们花费大量时间进入他们。手动编写临床笔记可能需要大量时间,增加患者的等待时间,并可能延迟诊断。大型语言模型(LLM),例如GPT-3具有生成与人类写作的新闻文章的能力。我们调查了对临床笔记生成中LLM的促进工程促进工程的用法(COT)。在提示中,我们将疾病国际分类(ICD)代码和基本患者信息以及类似的临床病例示例纳入了研究,以研究LLMS如何有效地制定临床注释。,我们使用GPT-4作为LLM对Codiesp测试数据集的六个临床病例进行了COT提示技术,结果表明,它的表现优于标准的零照片提示。
当代的大规模视觉语言模型(VLM)具有强大的表示能力,使它们无处不在,可以增强图像和文本理解任务。他们经常以对比的方式受到大量图像和相应的文本字幕的对比方式进行训练。尽管如此,VLMS经常在构图推理任务上挣扎,这些任务对对象及其属性的复杂相互作用进行了精细的了解。此失败可以归因于两个主要因素:1)对比的方法传统上专注于从现有数据集中开采负面示例。但是,该模型可能不难区分阳性检查。替代采矿的替代方法是负样本2),但现有的生成方法主要集中于生成与给定图像相关的硬性负面文本。在另一个方向上进行挖掘,即生成与给定文本相关的负面图像样本已被忽略。为了克服这两种限制,我们提出了一个框架,不仅在两个方向上矿山,而且在这两种方式(即图像和文本)中产生了有挑战性的负面样本。利用这些生成硬性负样本,我们在涉及多模式综合推理的任务中显着提高了VLMS的性能。我们的代码和数据集在https://ugorsahin.github.io/enhancing-- vlm.html上发布。
在离线模仿学习(IL)中,代理商旨在学习最佳的专家行为政策,而无需其他在线环境互动。但是,在许多现实情况下,例如机器人操纵,脱机数据集是从次优行为中收集的,没有奖励。由于稀缺的专家数据,这些代理通常会简单地记住较差的轨迹,并且容易受到环境变化的影响,因此缺乏对新环境推广的能力。要自动生成高质量的专家数据并提高代理的概括能力,我们提出了一个名为ffline i的框架,即通过进行反事实推断,并使用c oferfactual数据a u摄量(oilca)。尤其是我们利用可识别的变异自动编码器来生成反事实样本以进行专家数据增强。我们理论上分析了生成的专家数据的影响和概括的改进。此外,我们进行了广泛的实验,以证明我们的方法在两个d eep m ind c introl s uite基准测试基准上的分布性能和c ausal w orld w orld w orld w orld w orld w orld w orld基准的表现显着超过了各种基准。
下一代对话式 AI 系统需要:(1)逐步处理语言,逐个标记,以提高响应速度,并能够处理对话现象,例如暂停、重新开始和自我更正;(2)逐步推理,允许建立超出所说内容的意义;(3)透明且可控,允许设计人员和系统本身轻松确定特定行为的原因并针对特定用户组或领域进行定制。在这篇短文中,我们介绍了正在进行的初步工作,将动态语法(DS) - 一种增量语义语法框架 - 与资源描述框架(RDF)相结合。这为创建增量语义解析器铺平了道路,该解析器在话语展开时逐步输出语义 RDF 图。我们还概述了如何通过 RDF 将解析器与增量推理引擎集成。我们认为,这种 DS - RDF 混合体满足了上面列出的要求,产生了可用于构建响应式、实时、可解释的会话式 AI 的语义基础设施,可以针对特定用户群体(例如痴呆症患者)快速定制。
数字时代的数学教育(MEDE)系列探讨了数字技术支持数学教学和网络Geners学习的方式,也关注教育辩论。每卷都将在数学教育中解决一个特定问题(例如,视觉数学和网络学习;基于包容性和社区的电子学习;在数字时代的教学),以探索在数字技术的情况下探索有关教学和学习数学的基本假设。本系列旨在吸引各种各样的读者,包括:数学教育研究人员,数学家,认知科学家和计算机科学家,教育研究生,政策制定者,教育软件开发人员,管理人员和教师实践者。除其他外,本系列发表的高质量科学工作将解决与新一代数学学生的教学法和数字技术适用性有关的问题。该系列还将为读者提供更深入的了解,以了解创新的教学实践如何出现,进入课堂,并塑造成长为技术的年轻学生的学习。该系列还将介绍如何桥接理论和实践,以增强当今学生的不同学习方式,并将他们的动力和自然兴趣转变为对有意义的数学学习的额外支持。该系列为发现数字技术对学习成果的影响及其整合到有效的教学实践中的影响提供了机会;数学教育软件在教学和课程转换方面的潜力;以及数学电子学习的力量,是包容性和基于社区的,但个性化和实践的力量。
我们提出了一种基于辩论动态的知识图谱自动推理新方法。其主要思想是将三重分类任务构建为两个强化学习代理之间的辩论游戏,它们提取论据(知识图谱中的路径),目标是分别促使事实为真(论点)或事实为假(反论点)。基于这些论据,一个称为评判者的二元分类器决定事实是真是假。这两个代理可被视为稀疏的对抗性特征生成器,为论点或反论点提供可解释的证据。与其他黑箱方法相比,这些论据让用户能够了解评判者的决定。由于这项工作的重点是创建一种可解释的方法以保持具有竞争力的预测准确率,因此我们在三重分类和链接预测任务上对我们的方法进行了基准测试。因此,我们发现我们的方法在基准数据集 FB15k-237、WN18RR 和 Hetionet 上的表现优于几个基线。我们还进行了一项调查,发现提取的参数对用户很有帮助。
生物伦理学的标准观点区分了可能伤害或使特定个体受益的“影响个人”干预(例如通过基因组编辑)和决定哪个个体诞生的“影响身份”干预(例如通过基因选择)。斯帕罗对过去几十年来有关生殖技术争论的核心假设之一提出了质疑。他认为,对人类胚胎的直接基因改造不应归类为“影响个人”,而应归类为“影响身份”,因为在可预见的未来,任何基因组编辑“几乎肯定”涉及创建和编辑多个胚胎,以及通过植入前基因诊断选择“最佳”胚胎。斯帕罗还认为,“影响个人”和“影响身份”干预之间的区别具有至关重要的伦理意义:“我们选择胚胎的理由比我们修改胚胎的理由要弱”(Sparrow 2022 )。因此,他将基因组编辑归类为“影响身份”的干预,并得出结论,即使人们认为增强是道德义务,也没有理由要求制定法律来增强。在这篇评论文章中,我们更进一步质疑了有关生殖技术的生物伦理辩论中的核心假设。我们认为,“影响个人”和“影响身份”干预之间的区别是基于一种值得怀疑的物质起源本质主义。对这种本质主义的人类身份方法的质疑使得我们可以将基因组编辑和基因选择视为比标准方法中更相似的东西。它
根据所执行的程序和获得的证据,我们没有注意到任何情况使我们相信,公司在年度报告第 92 至 329 页中确定的可持续性信息与选定的 GRI 指标(以合并报告为基础)和选定的 BRSR 属性(不属于 BRSR 核心)有关,在 2023 年 4 月 1 日至 2024 年 3 月 31 日期间以独立报告为基础,在有限保证下,并未在所有重大方面按照世界资源研究所 (WRI)/世界可持续发展工商理事会 (WBCSD) 温室气体 (GHG) 议定书(企业会计和报告)编制