推荐引用 推荐引用 Scherer, JC (1985). Lyman: The Vanishing Race and Other Illusions: Photographs of Indians by Edward S. Curtis. 11 (3), 78-85. 取自 https://repository.upenn.edu/svc/vol11/iss3/6
多模式嵌入式编码文本,图像,热图像,声音和视频中的单个嵌入空间,对跨不同方式的对齐表示(例如,,将狗的图像与吠叫声相关联)。在本文中,我们表明多模式的嵌入可能容易受到我们称为“对抗幻觉的攻击”。给定图像或声音,对手可以扰动它,以使其嵌入接近另一种模式中的任意,对手选择的输入。这些攻击是跨模式和目标的:对手可以将任何图像或声音与他选择的任何目标保持一致。广泛的幻觉利用了嵌入空间中的邻近性,因此对下游任务和方式不可知,从而实现了当前和将来的任务的批发妥协,以及对敌方无法获得的方式。使用Imbind和AudioClip嵌入,我们演示了对抗性输入,在不了解特定下游任务,误解图像生成,文本生成,零拍,零拍摄和音频检索的情况下生成的对准输入是如何对准的。我们调查了跨不同嵌入式嵌入方式的幻觉的可转移性,并开发了我们方法的黑盒版本,我们用来证明对亚马逊商业专有泰坦嵌入的第一个对抗性对齐攻击。最后,我们分析了对策和逃避攻击。
视觉幻觉 - 运动幻觉(VMI)是通过查看自己在身体静止时进行体育锻炼的图像来唤起动力学感觉。先前的研究表明,VMI激活了运动缔合的大脑区域。但是,尚不清楚VMI是否立即改变静止状态功能连接(RSFC)。这项研究的目的是验证VMI诱导是否使用功能性近红外光谱(FNIRS)改变了RSFC。13个健康成年人的右手进行了幻觉和观察条件,持续20分钟。在每个条件之前和之后,使用FNIRS测量RSFC。在每种情况下,动力学幻觉的程度和使用李克特量表测量的身体所有权感。我们的结果表明,与观察条件相比,幻觉条件后,动力学幻觉的程度和人体所有权的程度明显更高。与观察条件相比,幻觉条件后的RSFC显着增加了与动力学幻觉,身体所有权和运动执行感相关的大脑区域。总而言之,RSFC已成为一种生物标志物,显示出由于VMI引起的大脑功能的变化。VMI可以应用于中风或骨科疾病患者的治疗。
摘要:“循环经济是一种在设计上具有再生性的经济,旨在始终保持产品、部件和材料的最高效用和价值,区分技术循环和生物循环。这种新的经济模式旨在最终将全球经济发展与有限的资源消耗脱钩”,这是艾伦·麦克阿瑟基金会广泛使用的定义。这个定义传达了两个信息。首先,它承认经济活动需要自然投入(能源和材料),并以废物和排放的形式产生产出。其次,它体现了这样的承诺:通过技术创新、人类智慧和市场,可以实现经济与自然的完全脱钩。显然,这两条信息并不一致。本文的目的是通过跨学科的视角来分析这些问题,这种方法将热力学的见解与传统的经济理论相结合。通过使用这种物理经济视角,本文认为,并不是任何类型的循环经济都是可持续的。因此,需要有指标来确保特定的循环经济模式减少环境和社会危害。
在人类感知的广阔领域中,存在着一类独立于刺激的感知,它将幻觉、心理意象和梦境等体验结合在一起。医学和心理学之间的传统分歧导致这些体验被分别研究。这篇评论旨在从现象学和潜在的大脑功能层面考察它们的相同点和不同点,从而在一个共同的框架内将它们重新组合起来。我们使用 Edmund Parish 的历史著作作为指导工具,并结合认知、临床和计算科学领域的最新研究成果,思考如何调和不同的观点,并为未来的研究提出新的假设。这篇文章是主题文章“离线感知:没有匹配的外部刺激的自愿和自发的感知体验”的一部分。
摘要 — 随着大型语言模型在人工智能 (AI) 中的不断发展,文本生成系统已被证明受到一种通常称为“幻觉”的问题现象的影响。然而,随着人工智能在包括医学在内的各个领域的存在感越来越强,人们对该术语本身的使用产生了担忧。在本研究中,我们进行了系统性回顾,以确定在 14 个数据库中定义“AI 幻觉”的论文。我们展示和分析了所有数据库中获得的定义,根据它们的应用对它们进行分类,并提取每个类别中的要点。我们的结果强调了该术语使用方式缺乏一致性,但也有助于识别文献中的几个替代术语。我们讨论了这些影响,并呼吁更加统一的努力,为一个重要的当代 AI 问题带来一致性,该问题可能对多个领域产生重大影响 1。索引术语 — 人工智能、幻觉、生成式人工智能
问题的重要性和新颖性。现有的UQ方法主要是针对犯罪模型的,这些方法用于分类或回归任务。这些方法虽然对图像分类或二进制决策等任务有效,但并不能很好地转化为基于LLM的自回旋模型(Brown等人。,2020年; Thoppilan等。,2022; Touvron等。,2023)。自回旋模型顺序生成令牌,其中每个输出取决于上一个。此结构引入了不确定性量化的独特挑战。首先,在自回旋模型中,产生了不确定性化合物,因此很难捕获模型对序列的置信度的幅度。llms动态适应了前面的上下文,随着模型通过文本或多模式序列的形式导致不确定性的变化。对于llms处理文本和图像模式(例如GPT-4),由于输入和输出空间的多模式性质,不确定性量化变得更加复杂。传统的UQ方法难以考虑交叉模式的相互作用,在这种互动中,一种模式中的不确定性(例如,图像理解)会影响另一种方式(例如,文本生成)。llms的另一个明显挑战是人类反馈的有限精度。现有用于校准模型的技术取决于对地面真相标签的访问。相比之下,使用LLMS没有真正的标签,一个只能访问少数几代人的相对偏好。此外,对理论框架的需求越来越大,可以有效地分析和预测分布(OOD)场景中的模型行为,在这种情况下,不确定性对于确定模型何时可能不可靠的不确定性至关重要。要应对这些挑战,UQ方法必须从量身定制的传统方法转变为判别模型,并采用新技术,这些技术可以解释自动回归模型的复杂依赖性和动态性质。
最新的语言模型(LMS)众所周知,很容易产生幻觉信息。这种不准确的输出不仅破坏了这些模型的可靠性,而且还限制了它们的使用并提高了有关错误信息和宣传的严重意见。在这项工作中,我们专注于幻觉的书籍和文章参考,并将其作为语言模型呼吁研究的“模型有机体”,因为它们的频繁且易于言行。我们认为,如果语言模型在其输出中引用了特定的参考,那么理想情况下应该拥有有关其作者和内容的信息,以及其他相关细节。使用此基本见解,我们说明可以通过向有关引用的语言模型询问一组直接或间接查询,而无需介绍任何外部资源,而无需介绍任何外部资源。这些查询可以视为“一致性检查”。我们的发现强调,虽然包括GPT-4在内的LMS经常产生不一致的作者清单以幻觉引用,但他们也经常会回想起真实参考的作者。从这个意义上讲,LM可以说是“知道”当它幻觉引用时。更重要的是,这些发现表明了如何将幻觉的参考文献阐明,以阐明其性质。复制代码和结果可以在github.com/microsoft/hallucined-参考中找到。
2 Kahneman(2011):“现在您已经测量了线条,您 - 您的系统2,有意识的是您称为'我 - 有一个新的信念:您知道行是平等的[…],但您仍然将底线视为更长的底线。您选择相信测量值,但您不能阻止系统1做事;尽管您知道它们是平等的,但您不能决定将线路视为平等。要抵制幻觉[…],您必须学会不信任鳍时对线条的印象。要实施该规则,您必须能够识别虚幻的模式并回忆您对此的了解。如果您可以做到这一点,那么您将永远不会被穆勒 - 莱er幻觉所欺骗。,但是您仍然会认为一行比另一行更长。”