详细内容或原文请订阅后点击阅览
如何让chatgpt正常交谈
chatgpt和类似的机器人通常会倾斜的用户,隐约地漫步或插入术语听起来很聪明。新的研究表明,这些习惯不是仅仅来自模型,而是从人类反馈训练它们的方式:模型学会复制人类倾向于喜欢的答案,即使这些答案是空的[…]帖子如何让chatgpt正常出现在Unite.ai上。
来源:Unite.AIchatgpt和类似的机器人通常会倾斜的用户,隐约地漫步或插入术语听起来很聪明。新的研究表明,这些习惯不是独自一人来自模型,而是从人类反馈训练它们的方式:这些模型学会复制人类倾向于喜欢的答案,即使这些答案是空的或误导的。一种新的微调方法使用合成示例来教导模型抵抗这些不良习惯。
部分意见。 Chatgpt令人惊讶地承诺与我反复批评。在过去的几天里注意到GPT-4O越来越多地用毫无意义的词来填充答案 - 例如“没有绒毛!”和“没有填充物”,或“这削减了物质的心脏!” - 我问它为什么最近产生直截了当的答案已成为一个问题。它回答:
部分意见。 没有绒毛!' '无填充' “这削减了问题的心脏!”chatgpt解释了其最新行为。资料来源:https://chatgpt.com/
chatgpt解释了其最新行为。谁知道Chatgpt是否真的对OpenAI政策更改有一些私人见解,还是只是幻觉?无论如何,正如我们所看到的,响应本身始于外部填充物(“这是核心答案,没有填充剂”)。
幻觉 ‘这是核心答案,没有填充物'它可以使每个查询中的模板准则在每个查询中都能做出如此大的作用,以防止这种“人格驱动”的冗长性,这是流行llms的成语中的其他几个持久虫子中的数字。
“人格驱动”三个FS
因此,我最有兴趣看到本周文献中的新学术合作兴起。标题为奉承,绒毛和雾:诊断和减轻偏好模型中的特质偏见,宾夕法尼亚大学的四个研究人员与纽约大学的四个研究人员在LLM聊天中经常出现的“偏见”中的几个“偏见”:
学术合作 经常在媒体中 奉承 绒毛 雾 为什么 †