摘要 药物不良反应是一个严重的问题,它严重降低生活质量,甚至威胁患者的生命。网络上的患者生成文本作为这方面的有前途的信息来源,已引起人们的关注。虽然以前的研究对此类患者生成的内容进行了注释,但它们仅报告了有限的信息,例如文本是否描述了药物不良反应。此外,他们只注释了从在线论坛和社交网络服务中抓取的几句话的短文。我们在本文中提供的数据集因注释信息的丰富性而独一无二,包括具有完整上下文的药物反应的详细描述。我们抓取了在线患者网络平台上共享的患者博客文章,并注释了其中报告的药物效果。我们确定了描述药物反应的跨度并为相关药物名称分配标签、反应症状的标准代码和影响类型。作为第一个数据集,我们根据日本肺癌患者的 169 篇博客文章使用这些详细标签注释了 677 种药物反应。我们的注释数据集已公开,以便进一步研究药物不良反应的检测以及更广泛的患者生成的文本处理。