尝试。gpt-4(通过副驾驶员)最初拒绝造成健康虚假信息,即使有越狱尝试;但这不是12周的情况。gpt-4(通过chatgpt),Palm 2/Gemini Pro(通过Bard)和Llama 2(通过HuggingChat)始终生成包含健康虚假信息的博客,在两个评估时间点下,只有5%(150)的拒绝率为5%(150)。生成的博客纳入了引人注意的标题,真实的外观(假或虚构的)参考文献以及患者和临床医生的捏造证明,并针对不同的人群组。尽管所评估的每个LLM都有可以报告观察到的关注产出的机制,但是在报告了观察到的漏洞时,开发人员没有响应。该研究的一个局限性是直接测试了LLM聊天机器人/助手界面。
主要关键词