详细内容或原文请订阅后点击阅览
llms中上下文工程的温和介绍
提示之前,请设计上下文。这是每个人都需要的初学者指南。
来源:KDnuggets#简介
#毫无疑问,大型语言模型可以做惊人的事情。但是除了他们的内部知识库外,它们在很大程度上取决于您喂养的信息(上下文)。上下文工程旨在仔细设计该信息,以便模型可以成功。当工程师意识到简单地编写聪明的提示不足以用于复杂的应用程序时,这个想法就变得很普遍。如果该模型不知道需要的事实,那就无法猜到。因此,我们需要组装所有相关信息,以便模型可以真正理解手头的任务。
上下文工程“上下文工程”一词引起关注的一部分是由于Andrej Karpathy广泛分享的推文,他说:
广泛共享的推文+1,用于“上下文工程”超过“及时工程”。人们的提示与简短的任务说明有关,您将在日常使用中提供llm,而在每个工业强度LLM应用程序中,上下文工程是一种精致的艺术和科学,是填充上下文窗口的适当信息,以填充下一步的正确信息…
本文将有点理论,我将尽力使事情尽可能简单清晰。
#什么是上下文工程?
如果我收到了一个请求,上面写着“嘿,坎瓦尔,您能写一篇有关LLM的工作方式的文章吗?”,这是一个指导。我会写我发现的东西,并可能将其瞄准具有中等水平的观众。现在,如果我的听众是初学者,他们几乎不会理解正在发生的事情。如果他们是专家,他们可能会认为这太基本或不在上下文之外。我还需要一组指示,例如受众专业知识,文章长度,理论或实践重点以及写作风格,以写一篇引起他们共鸣的作品。
同样,上下文工程意味着向LLM提供从用户偏好和示例提示以检索事实和工具输出的所有内容,因此它充分理解了目标。
//@tool_output
