尽管序列到序列模型在许多摘要数据集中都达到了最先进的性能,但是中国社交媒体文本的处理中仍然存在一些问题,例如短句子,缺乏连贯性和准确性。这些问题是由两个因素引起的:基于RNN的序列模型的原理是最大似然估计,这将导致产生长摘要时梯度消失或爆炸;中国社交媒体中的文字漫长而嘈杂,很难产生高质量的摘要。为了解决这些问题,我们应用了序列生成的对抗网络框架。该框架包括生成器和歧视器,其中生成器用于生成摘要,并使用歧视器来评估生成的摘要。软核层层用作连接层,以确保发电机和歧视器的共培训。实验是在大规模的中国社交媒体文本摘要数据集上进行的。句子的长度,胭脂评分和摘要质量的人工得分用于评估生成的摘要。结果表明,我们的模型生成的摘要中的句子更长且准确性更高。
主要关键词