护栏关键词检索结果

一个简单的链接如何让黑客绕过 Copilot 的安全防护栏 - 以及 Microsoft 对此采取的措施

How a simple link allowed hackers to bypass Copilot's security guardrails - and what Microsoft did about it

重新提示让攻击者控制 Copilot 并提取您的数据,即使您关闭了聊天也是如此。

Anindya Das Antar 访谈:评估审核护栏在调整 LLM 输出方面的有效性

Interview with Anindya Das Antar: Evaluating effectiveness of moderation guardrails in aligning LLM outputs

他们在 AIES 2025 上发表的论文“你的护栏能守卫吗?”评估审核护栏在使 LLM 输出与专家用户期望保持一致方面的有效性的方法 Anindya Das Antar、Xun Huan 和 Nikola Banovic 提出了一种评估和选择护栏的方法,该方法能够最好地将 LLM 输出与主题专家的领域知识保持一致。在这里,[...]

马杜罗被捕暴露了宪法限制的“摇摇欲坠的护栏”

Maduro Arrest Exposes “Crumbling Guardrails” of Constitutional Limits

在美国军队逮捕残暴的委内瑞拉社会主义独裁者尼古拉斯·马杜罗后,卡托研究所法律研究高级副院长克拉克·尼利发布了一篇新的博客文章,题为:委内瑞拉——起诉、入侵和宪法摇摇欲坠的护栏。在博客中,内利详细介绍了委内瑞拉最近的军事行动引起的严重宪法问题:宪法对外交权力的限制并不会仅仅因为法院拒绝执行而消失。它们既作为结构性承诺又作为警告而持续存在。弹劾和政治问责可能是对此类行动的唯一制衡,这一事实并不是解决方案;这是一种日益危险的病态,使美国面临比任何单一外国独裁者都更大的风险,即使是像尼古拉斯·马杜罗那样残酷和具有破坏性的独裁者。此外,内利的见解已在最近有关马杜罗被捕的报道中得到运用,包括:诺列加案可以

自由主义者辩论:自由主义者对临终立法中医疗援助的不同观点

Libertarian Debate: Contrasting Libertarian Views on Medical Aid in Dying Legislation

在最近的一篇专栏文章中,卡托研究所学者杰弗里·辛格 (Jeffrey Singer) 博士通过传统的自由主义论点,阐述了他对纽约悬而未决的临终医疗援助 (MAiD) 合法化的看法。然而,卡托研究所法学学者马修·卡夫顿提出了不同的自由主义观点,部分写道:“正如自由主义思想家穆雷·罗斯巴德所写,没有人能够‘摆脱自己的意志,而这种意志在未来几年可能会改变,并否定当前的安排。’对我来说,这就是问题的关键:自由主义接受人们当前自由的某些护栏,以维护他们未来的自由,而且它是完全符合反对 MAiD 合法化的原则。”,要与 Cavedon 进一步讨论 MAiD 合法化,请联系 Christopher Tarv

“混乱的残酷”:特朗普政府国内外暴力升级

“Chaotic cruelty”: Trump administration escalating violence at home and abroad

从明尼苏达州到格陵兰岛,特朗普政府正在推平旨在保护人类生命和尊严的护栏。《混乱的残酷》:特朗普政府在国内外不断升级暴力的帖子首先出现在澳大利亚研究所上。

Grok 为塑造年轻女孩穿着“性感服装”的形象而道歉

Grok apologizes for creating image of young girls in “sexualized attire”

在生成了可能违反美国儿童性虐待材料法的内容后,Grok 再次强调了人工智能护栏的无效性。