社交媒体研究的综合数据似乎是具有有趣潜力的特征,但由于缺乏对现实世界数据的参考,它仍然受到损害。Chatgpt生成的合成数据在验证包含LLM建议的主题标签的帖子的存在时,表明这种相关性极为不一致,并且CHAT-GPT提供的绝大多数Instagram帖子要么不解决或不包含任何相关的主题标签。合成数据在这个意义上并不代表现实世界数据,该数据强调了Chatgpt在建议相关的主题标签时似乎如何关注语义相似性,并且对平台上共享内容共享内容的共享实践没有掌握,可能是它们的内容或面向市场(定位)。然而,合成数据仍然可以证明分析有用性。在比较自动和手动群集标签时(在平台上使用这些主题标签对社区和帖子进行了个性化之后,或者由Chatgpt产生它们),实际上,聊天机器人和研究人员产生的标签中具有显着的亲和力(与手动编码的簇相比,由6个出现了6个)。1。简介