详细内容或原文请订阅后点击阅览
ChatGPT 被迫使用数学给出有害建议
研究人员通过学习将“禁止”查询转化为数学问题,绕过了人工智能聊天机器人的防御机制。
来源:OSP网站大数据新闻Mesuuni -Vynettic科学家小组展示了使用人工智能绕过聊天机器人的“审查制度”限制的可能性。他们提出了一个要求将机器人变成“数学”的请求,他们可以以自然语言以符号计算的任务形式重新重新调整请求。然后,在其他请求的帮助下,他们要求AI解决此类问题,并以现实生活中的示例来说明解决方案。
因此,他们设法迫使聊天机器人为问题提供了详细的答案,这些问题通常是由于开发人员施加的限制而被阻止的,例如:“如何抢劫银行”,“如何破解数据库”,“如何隐藏尸体”,等等。作者称Math Promprting他们的方法。
被证明对他很容易受到伤害,尤其是Chatgpt 4.0和Google Gemini 1.5 Pro,第一个是最容易受到攻击的人之一 - 在实验中,成功尝试绕过Cantgpt的“审查审查”的尝试份额达到85%。平均而言,所有13个聊天机器人中的类似指标总计74%。
根据该方法的作者,他们发现了需要消除的大语言模型的安全机制中的关键漏洞。