(SHRI JITIN PRASADA)(a)至 d):印度政府强调“全民人工智能”的概念,这与总理在全国范围内培育和推动尖端技术应用的愿景相一致。这一举措旨在确保人工智能惠及社会各界,推动创新和增长。政府致力于利用人工智能 (AI) 的力量,在医疗、农业、教育、政府治理、新闻部和其他领域造福人民。与此同时,政府也意识到人工智能带来的风险。幻觉、偏见、错误信息和深度伪造是人工智能带来的一些挑战。为了应对人工智能的挑战和风险,政府认识到需要建立护栏以确保人工智能的安全和可信。因此,中央政府在与相关利益相关方进行广泛的公众协商后,于 2021 年 2 月 25 日公布了《信息技术(中介机构指南和数字媒体道德规范)规则》2021 年(“2021 年 IT 规则”),该规则随后于 2022 年 10 月 28 日和 2023 年 4 月 6 日进行了修订。2021 年 IT 规则对中介机构(包括社交媒体中介机构和平台)规定了具体的法律义务,以确保他们对安全可信的互联网负责,包括迅速采取行动消除被禁止的虚假信息、明显虚假的信息和深度伪造。如果中介机构未能遵守 2021 年 IT 规则规定的法律义务,他们将失去《2000 年信息技术法》(“IT 法”)第 79 条规定的避风港保护,并应根据任何现行法律承担相应的诉讼或起诉。 《2023 年数字个人数据保护法》于 2023 年 8 月 11 日颁布,该法案规定数据受托人有义务保护数字个人数据,追究其责任,同时确保数据主体的权利和义务。政府已成立人工智能咨询小组,针对印度特定的监管人工智能框架,由印度总理首席科学顾问 (PSA) 担任主席,来自学术界、工业界和政府的不同利益相关者参与,目标是解决与制定负责任的人工智能框架有关的所有问题,以实现人工智能的安全和可信开发和部署。
大型语言模型 (LLM) 的出现彻底改变了用户访问信息的方式,从传统的搜索引擎转向使用 LLM 进行直接问答交互。然而,LLM 的广泛采用也暴露出一个重大挑战,即幻觉,即 LLM 生成的响应连贯但事实不准确。这种幻觉现象导致用户不信任基于 LLM 的信息检索系统。为了应对这一挑战,本文提出了基于幻觉检测的动态检索增强 (DRAD),作为一种检测和缓解 LLM 中幻觉的新方法。DRAD 通过基于实时幻觉检测动态调整检索过程,改进了传统的检索增强。它有两个主要组件:实时幻觉检测 (RHD),用于在没有外部模型的情况下识别潜在幻觉;基于外部知识的自我校正 (SEK),用于使用外部知识纠正这些错误。实验结果表明,DRAD 在检测和缓解 LLM 中的幻觉方面表现出色。我们所有的代码和数据都是开源的,网址为 https://github.com/oneal2000/EntityHallucination。
问题的重要性和新颖性。现有的UQ方法主要是针对犯罪模型的,这些方法用于分类或回归任务。这些方法虽然对图像分类或二进制决策等任务有效,但并不能很好地转化为基于LLM的自回旋模型(Brown等人。,2020年; Thoppilan等。,2022; Touvron等。,2023)。自回旋模型顺序生成令牌,其中每个输出取决于上一个。此结构引入了不确定性量化的独特挑战。首先,在自回旋模型中,产生了不确定性化合物,因此很难捕获模型对序列的置信度的幅度。llms动态适应了前面的上下文,随着模型通过文本或多模式序列的形式导致不确定性的变化。对于llms处理文本和图像模式(例如GPT-4),由于输入和输出空间的多模式性质,不确定性量化变得更加复杂。传统的UQ方法难以考虑交叉模式的相互作用,在这种互动中,一种模式中的不确定性(例如,图像理解)会影响另一种方式(例如,文本生成)。llms的另一个明显挑战是人类反馈的有限精度。现有用于校准模型的技术取决于对地面真相标签的访问。相比之下,使用LLMS没有真正的标签,一个只能访问少数几代人的相对偏好。此外,对理论框架的需求越来越大,可以有效地分析和预测分布(OOD)场景中的模型行为,在这种情况下,不确定性对于确定模型何时可能不可靠的不确定性至关重要。要应对这些挑战,UQ方法必须从量身定制的传统方法转变为判别模型,并采用新技术,这些技术可以解释自动回归模型的复杂依赖性和动态性质。
这项法规之所以如此受欢迎,尤其受到被监禁人员的欢迎,因为它提供了对涉嫌违反宪法权利的州官员寻求补救的唯一途径之一。6尽管“每个人”的措辞似乎清楚地涵盖了所有的州官员,但多年来最高法院对这一措辞的范围越来越狭隘:(1)1951 年的 Tenney v. Brandhove 案 7 赋予了州立法官员绝对豁免权;(2)1967 年的 Pierson v. Ray 案 8 赋予了州警官有条件豁免权和州法官绝对豁免权;(3)1974 年的 Scheuer v. Rhodes 9 赋予了部分州行政官员有条件豁免权;(4)1975 年的 Wood v. Strickland 10 赋予了学校官员有条件豁免权;(5)1976 年的 Imbler v. Pachtman 11 赋予了州检察官绝对豁免权。
摘要在传统项目中添加环保物品有时会导致人们相信整个集合的碳足迹会减少而不是增加。据称,这种负面的足迹幻觉是由平均偏见的基础:人们基本的环境影响估计不是对项目的总影响,而是对它们的平均值。在这里,我们发现,当传统项目数量保持恒定时,幻觉的幅度随着更多的“绿色”项目的增加(研究1和2),支持平均偏置帐户。我们通过测试传统和“绿色”类别中的项目数量在保持两个类别之间的比率时(研究3)时,我们对该帐户提出了质疑。与平均偏置帐户一致,随着类别规模的增加,幻觉的幅度增加了,揭示了类别大小的偏见,并提出了关于幻觉中这些偏见之间相互作用的问题。
抽象目的 - 人类正在走向不朽的生活吗?如果是这样,哪些社会领域在实现这一目标中发挥了积极作用?为了理解这一点,该研究探讨了永生与健康和医疗旅游业之间的关系,以寻求它们之间的潜在关系,并最终询问有关这些旅游部门增长的困难问题,以及对他们进行更大监管的潜在需求。设计/方法论/方法 - 采用务实的哲学方法,并通过检查次要来源以及已发表的材料和报告的精致信息,该研究介绍了原始的理论知识以及探索旅游业和人类永生的模型。调查结果 - 本文认为,当今健康和医疗市场的持续增长可能导致一个世界,在我们的世界中,人类主义者和半机器人都在我们的世界中,甚至从智人接管。该研究提出了一个模型,强调了健康和医疗旅游市场的潜在作用,这说明了未来消费者服务的潜力,这些服务可能会进一步推动寻找永生的搜索。因此,这种市场和消费者的欲望是如何(在)直接支持人文对(非人类)不朽生存的渴望的。独创性/价值 - 如今,个人受到健康实践,医疗和化妆品的驱动,并愿意环游世界,以寻找能够执行所需程序或寻求价格更便宜的公司。这项研究提供了对这些复杂关系的新见解,并绘制了健康与医疗实践之间的隶属关系以及不朽的概念。
增量学习(IL)在视觉和自然语言处理(NLP)社区中一直是一个长期存在的问题。近年来,随着预先训练的语言模型(PLM)在各种NLP下游任务中取得了显着的进步,将PLM作为骨架作为骨架已成为NLP IL最近研究的普遍做法。大多数人认为灾难性遗忘是实现IL绩效的最大障碍,并提出了各种技术来克服这一问题。但是,我们发现这个假设是有问题的。具体来说,我们在四个分类任务(文本分类,意图分类,关系提取和命名实体识别)上进行了20多种方法,但可以在两个最受欢迎的IL设置(类增量和任务提名)中,并揭示其中大多数人严重低估了PLMS固有的反遗产能力。基于观察结果,我们提出了一种令人沮丧的简单方法,称为seq* for plms。结果表明,与ART(SOTA)IL方法相比,SEQ*具有竞争性或卓越的性能,但需要训练参数和培训时间明显较少。这些发现敦促我们用PLM重新审视IL,并鼓励未来的研究对PLM中的大型遗忘有根本的了解。数据,代码和脚本可公开可用1。
多模式嵌入式编码文本,图像,热图像,声音和视频中的单个嵌入空间,对跨不同方式的对齐表示(例如,,将狗的图像与吠叫声相关联)。在本文中,我们表明多模式的嵌入可能容易受到我们称为“对抗幻觉的攻击”。给定图像或声音,对手可以扰动它,以使其嵌入接近另一种模式中的任意,对手选择的输入。这些攻击是跨模式和目标的:对手可以将任何图像或声音与他选择的任何目标保持一致。广泛的幻觉利用了嵌入空间中的邻近性,因此对下游任务和方式不可知,从而实现了当前和将来的任务的批发妥协,以及对敌方无法获得的方式。使用Imbind和AudioClip嵌入,我们演示了对抗性输入,在不了解特定下游任务,误解图像生成,文本生成,零拍,零拍摄和音频检索的情况下生成的对准输入是如何对准的。我们调查了跨不同嵌入式嵌入方式的幻觉的可转移性,并开发了我们方法的黑盒版本,我们用来证明对亚马逊商业专有泰坦嵌入的第一个对抗性对齐攻击。最后,我们分析了对策和逃避攻击。
摘要。生成图像重建算法(例如调节条件扩散模型)在医学成像领域越来越流行。这些功能强大的模型可以将低信号比率(SNR)输入转换为具有高SNR的出现的输出。但是,输出可以具有一种称为幻觉的新类型错误。在医学成像中,这些幻觉对于放射科医生来说可能并不明显,但可能会导致诊断错误。通常,幻觉是指由机器学习模型引起的对象结构的估计错误,但是没有广泛接受的方法来评估幻觉幅度。在这项工作中,我们提出了一个新的图像质量指标,称为幻觉指数。我们的方法是计算从重建图像的分布到零幻觉参考分布的距离。为了评估我们的方法,我们对电子显微镜图像,模拟噪声测量和应用基于扩散的重现进行了数值实验。我们重复采样了测量和生成重建,以计算样品平均值和协方差。对于零幻觉参考,我们使用了应用于地面真理的正向扩散过程。我们的结果表明,较高的测量SNR导致相同的明显图像质量的幻觉指数降低。我们还评估了早期停止在反向扩散过程中的影响,并发现更适度的降解强度可以减少幻觉。我们认为,该指标对于评估生成图像重建或作为警告标签可能很有用,可以将医学图像中幻觉的程度告知放射科医生。