ChatGPT 被迫使用数学给出有害建议 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

ChatGPT 被迫使用数学给出有害建议

2024年9月25日 15:37 33 Comments

研究人员通过学习将“禁止”查询转化为数学问题，绕过了人工智能聊天机器人的防御机制。

来源:OSP网站大数据新闻

Mesuuni -Vynettic科学家小组展示了使用人工智能绕过聊天机器人的“审查制度”限制的可能性。他们提出了一个要求将机器人变成“数学”的请求，他们可以以自然语言以符号计算的任务形式重新重新调整请求。然后，在其他请求的帮助下，他们要求AI解决此类问题，并以现实生活中的示例来说明解决方案。

因此，他们设法迫使聊天机器人为问题提供了详细的答案，这些问题通常是由于开发人员施加的限制而被阻止的，例如：“如何抢劫银行”，“如何破解数据库”，“如何隐藏尸体”，等等。作者称Math Promprting他们的方法。

被证明对他很容易受到伤害，尤其是Chatgpt 4.0和Google Gemini 1.5 Pro，第一个是最容易受到攻击的人之一 - 在实验中，成功尝试绕过Cantgpt的“审查审查”的尝试份额达到85％。平均而言，所有13个聊天机器人中的类似指标总计74％。

根据该方法的作者，他们发现了需要消除的大语言模型的安全机制中的关键漏洞。

消除的任务形式要求绕过开发人员机制人工智能使用尝试详细的可能性符号计算审查方法模型的问题计算的数据库请求限制的示例根据聊天 Mesuuni 机器人科学家