摘要。生成图像重建算法(例如调节条件扩散模型)在医学成像领域越来越流行。这些功能强大的模型可以将低信号比率(SNR)输入转换为具有高SNR的出现的输出。但是,输出可以具有一种称为幻觉的新类型错误。在医学成像中,这些幻觉对于放射科医生来说可能并不明显,但可能会导致诊断错误。通常,幻觉是指由机器学习模型引起的对象结构的估计错误,但是没有广泛接受的方法来评估幻觉幅度。在这项工作中,我们提出了一个新的图像质量指标,称为幻觉指数。我们的方法是计算从重建图像的分布到零幻觉参考分布的距离。为了评估我们的方法,我们对电子显微镜图像,模拟噪声测量和应用基于扩散的重现进行了数值实验。我们重复采样了测量和生成重建,以计算样品平均值和协方差。对于零幻觉参考,我们使用了应用于地面真理的正向扩散过程。我们的结果表明,较高的测量SNR导致相同的明显图像质量的幻觉指数降低。我们还评估了早期停止在反向扩散过程中的影响,并发现更适度的降解强度可以减少幻觉。我们认为,该指标对于评估生成图像重建或作为警告标签可能很有用,可以将医学图像中幻觉的程度告知放射科医生。
这项法规之所以如此受欢迎,尤其受到被监禁人员的欢迎,因为它提供了对涉嫌违反宪法权利的州官员寻求补救的唯一途径之一。6尽管“每个人”的措辞似乎清楚地涵盖了所有的州官员,但多年来最高法院对这一措辞的范围越来越狭隘:(1)1951 年的 Tenney v. Brandhove 案 7 赋予了州立法官员绝对豁免权;(2)1967 年的 Pierson v. Ray 案 8 赋予了州警官有条件豁免权和州法官绝对豁免权;(3)1974 年的 Scheuer v. Rhodes 9 赋予了部分州行政官员有条件豁免权;(4)1975 年的 Wood v. Strickland 10 赋予了学校官员有条件豁免权;(5)1976 年的 Imbler v. Pachtman 11 赋予了州检察官绝对豁免权。
摘要 ................................................................................................................................................. v
只有通过实验来测试形式或计算模型,才能获得机械洞察力。此外,与病变研究类似,幻觉感知可以作为理解健康听觉感知的基本处理原理的载体。我们特别关注耳鸣——作为听觉幻觉感知的主要例子——回顾了人工智能、心理学和神经科学交叉领域的最新研究。特别是,我们讨论了为什么每个耳鸣患者都会遭受(至少是隐藏的)听力损失,但并不是每个听力损失患者都会遭受耳鸣。我们认为,内在神经噪声是沿着听觉通路产生和放大的,是一种基于自适应随机共振恢复正常听力的补偿机制。神经噪声的增加可能会被误认为是听觉输入并被感知为耳鸣。这种机制可以在贝叶斯大脑框架中形式化,其中感知(后验)吸收了先前的预测(大脑的期望)和可能性(自下而上的神经信号)。可能性的较高均值和较低方差(即增强的精度)会改变后验概率,表明对感官证据的误解,而大脑中支持先前预测的可塑性变化可能会进一步混淆这种误解。因此,两个基本处理原理为听觉幻觉的出现提供了最有力的解释力:预测编码是一种自上而下的机制,而自适应随机共振是一种互补的自下而上的机制。我们得出结论,这两个原理在健康的听觉感知中也发挥着至关重要的作用。最后,在神经科学启发的人工智能背景下,这两个处理原理都可能有助于改进当代的机器学习技术。
能够处理和生成多模式数据的基础模型已改变了AI在医学中的作用。然而,其可靠性的关键局限性是幻觉,其中不准确或捏造的信息会影响临床决策和患者安全。我们将医疗幻觉定义为模型产生误导性医学内容的任何实例。本文探讨了医学利润率的独特特征,原因和含义,特别关注这些错误如何在现实世界中的临床情况下表现出来。我们的贡献包括(1)用于理解和解决医学幻觉的分类法,(2)使用医学幻觉数据集对模型进行基准测试模型,以及对实际医疗病例的LLM的反应,从而直接了解幻觉的临床影响,以及(3)对医疗幻觉的多政治临床调查。我们的结果表明,诸如链链(COT)和搜索增强产生等推论技术可以有效降低幻觉率。,尽管有这些改进,但幻觉的非平凡水平仍然存在。这些发现强调了强大的检测和缓解策略的道德和实践意义,为监管政策建立了优先级的监管政策基础,随着AI的融合更加集成到医疗保健中。临床医生的反馈意见不仅迫切需要技术进步,而且还需要更清晰的道德和监管指南,以确保患者安全。可在https://github.com/mitmedialab/medical幻觉上提供纸张资源,摘要和其他信息的存储库。
摘要在传统项目中添加环保物品有时会导致人们相信整个集合的碳足迹会减少而不是增加。据称,这种负面的足迹幻觉是由平均偏见的基础:人们基本的环境影响估计不是对项目的总影响,而是对它们的平均值。在这里,我们发现,当传统项目数量保持恒定时,幻觉的幅度随着更多的“绿色”项目的增加(研究1和2),支持平均偏置帐户。我们通过测试传统和“绿色”类别中的项目数量在保持两个类别之间的比率时(研究3)时,我们对该帐户提出了质疑。与平均偏置帐户一致,随着类别规模的增加,幻觉的幅度增加了,揭示了类别大小的偏见,并提出了关于幻觉中这些偏见之间相互作用的问题。
大型语言模型 (LLM) 的出现彻底改变了用户访问信息的方式,从传统的搜索引擎转向使用 LLM 进行直接问答交互。然而,LLM 的广泛采用也暴露出一个重大挑战,即幻觉,即 LLM 生成的响应连贯但事实不准确。这种幻觉现象导致用户不信任基于 LLM 的信息检索系统。为了应对这一挑战,本文提出了基于幻觉检测的动态检索增强 (DRAD),作为一种检测和缓解 LLM 中幻觉的新方法。DRAD 通过基于实时幻觉检测动态调整检索过程,改进了传统的检索增强。它有两个主要组件:实时幻觉检测 (RHD),用于在没有外部模型的情况下识别潜在幻觉;基于外部知识的自我校正 (SEK),用于使用外部知识纠正这些错误。实验结果表明,DRAD 在检测和缓解 LLM 中的幻觉方面表现出色。我们所有的代码和数据都是开源的,网址为 https://github.com/oneal2000/EntityHallucination。
撒谎 - 做出欺骗意图的不真实陈述的行为[74] - 长期以来一直是道德哲学中的重要主题[8,35,55]。许多学者都研究了撒谎 - 在哪种情况下,可以接受[13,63,71],对撒谎的看法如何在文化和年龄之间有所不同[15,37]等。但是,从叙事构建,讲故事的角度,撒谎和欺骗可以用作探索和增强写作的主题主题[67,80]。谎言的角色可以为故事增添一定程度的歧义和道德复杂性[83,121];这种欺骗可以帮助表征作品的角色,增加戏剧化和阴谋的水平,并增强读者从故事中脱颖而出的隐喻含义。扩展了在叙事写作中使用欺骗的概念,视频游戏是一种越来越多地用于讲述故事和传达叙事的媒介,以使人们发笑,哭泣和思考[10,45]。与传统的讲故事形式(例如书籍或电影)相反,游戏为玩家提供了高度的互动性,可以控制他们的选择和决定[59]。在这种体验中,游戏可以通过其虚拟代理提供一种社交互动形式 - 不可玩的字符(NPC)[1,5]。与NPC的互动是游戏的重要组成部分,因为它们会影响玩家感到[112],提供情感关系和依恋的车辆[14]的现实主义和沉浸度[14],并增加了玩家从游戏中带走的欣赏和意义的感觉[45]。游戏中互动性的负担能力为玩家提供了代理机构,他们想要移动的方式,他们想要如何互动等。我们考虑了这样一个问题,即这种玩家驱动的互动如何影响并受到信任和启示方面的影响,尤其是NPC和玩家之间的互动。,有着相对稀缺的工作,着眼于玩家如何看待NPC中的真实性,谎言和欺骗。由于自然主义的NPC对话和互动的快速研究改善了越来越重要的差距(例如通过AI方法[72,84])与他们以前的有限和僵化的行为形成对比[60]。我们考虑以下研究问题,从最初启动游戏到游戏后的外卖阶段,也可以构成游戏玩法体验的不同阶段。
摘要 传统的解释性资源,例如用户手册和教科书,通常包含的内容可能无法满足用户的不同背景和信息需求。然而,开发直观的、以用户为中心的方法来有效地解释复杂或大量的信息仍然是一个开放的研究挑战。在本文中,我们介绍了 ExplanatoryGPT,这是我们设计和实施的一种方法,用于将文本文档转换为交互式智能资源,能够提供动态、个性化的解释。我们的方法使用最先进的问答技术来生成按需、可扩展的解释,目的是让读者有效地浏览和理解静态材料。ExplanatoryGPT 将最先进的语言模型 ChatGPT 与 Achinstein 的哲学解释理论相结合。通过将问题生成和答案检索算法与 ChatGPT 相结合,我们的方法可以生成以用户为中心的交互式解释,同时缓解与 ChatGPT 相关的常见问题,例如幻觉和记忆缺陷。为了展示我们的解释性 AI 的有效性,我们使用各种来源进行了测试,包括法律教科书和一些健康和金融软件的文档。具体来说,我们提供了几个示例,说明了 ExplanatoryGPT 如何在生成更精确的解释方面优于 ChatGPT,这是通过对解释内容进行深思熟虑的宏观规划来实现的。值得注意的是,我们的方法还避免了需要提供解释的整个上下文作为 ChatGPT 的提示,由于常见的内存限制,这个过程通常是不可行的。
太阳系的图景将电子和质子描绘成微小的、固体的、类似行星的结构,它们围绕着原子中较大的内部中子旋转,这是完全错误的。电子、μ子、τ子、夸克和胶子没有内部结构,也没有物理尺寸,这意味着它们完全是虚幻的,或者换句话说,是由能量组成的。它们是零维的,更像是事件而不是事物。更糟糕的是,人们发现电子(带负电的粒子,不是真正的粒子)同时是波和粒子(波粒二象性)。电子以某种形式出现,具体取决于所涉及的实验。它们也很难被确定——毕竟,当一切都是能量时,很难让它保持在一个地方。科学家可以知道粒子的速度或位置,但不能同时知道两者。这就像警察在州际公路上以 150 英里/小时的速度记录一辆汽车,但却无法找到它来追赶它。高能粒子的另一个奇怪习性是它们可以同时出现在多个地方。电子和其他非粒子粒子被称为“叠加”,