教程:用LLM提示的用户消息的语义聚类

作为开发人员倡导者,跟上用户论坛消息并了解用户在说什么的全局是一项挑战。有很多有价值的内容 - 但是您如何快速发现关键对话?在本教程中,我将向您展示一个AI hack,仅通过提示LLMS来执行语义聚类! […]帖子教程:使用LLM提示的用户消息的语义聚类首先出现在数据科学上。

来源:走向数据科学

作为开发人员倡导者,跟上用户论坛消息并了解用户在说什么的全局是一项挑战。有很多有价值的内容 - 但是您如何快速发现关键对话?在本教程中,我将向您展示一个AI hack,仅通过提示LLMS来执行语义聚类!

tl; dr🔄此博客文章是关于如何从(Data Science + Code)→(AI提示 + LLMS)出现相同结果的方法 - 更快,更少的努力! 🤖⚡。它的组织如下:

    灵感和数据sourcesexplater用dashboardsllm提示通过多个不符号服务器
  • 灵感和数据来源
  • 使用仪表板探索数据
  • llm提示产生KNN簇
  • 实验自定义嵌入
  • 跨多个Discord服务器聚类
  • 灵感和数据来源

    灵感和数据来源

    首先,我将向2024年12月的纸张Clio(Claude Insights and Oversives)提供道具,这是一个隐私保护平台,使用AI助手来分析和表面汇总的使用模式,以数百万对话。阅读本文激发了我尝试。

    2024年12月纸的道具 clio clio (Claude Insights和Obsives)

    数据。我仅使用了公开可用的不便消息,特别是“论坛线程”,用户在此寻求技术帮助。此外,我为此博客汇总了匿名内容。  每个线程,我将数据格式化为对话转向格式,用户角色确定为“用户”,询问问题或“助手”,任何人都回答用户的初始问题。我还添加了一个简单的,硬编码的二进制情感分数(“不开心”的0,为“ happy” 1),根据用户是否在他们的话题中表示感谢。对于VectordB供应商,我使用了Zilliz/Milvus,Chroma和Qdrant。

    数据 Discord

    我添加了一个天真的情感0 | 1评分函数。

    def Calc_score = [ “谢谢” “谢谢” “ THX” “🙂” “😉” “👍” ] def contains_target_words = “”