人工智能正在使新闻语言变得更加重复和可预测——这对我们所有人来说都是一个问题

Markus Winkler / Unsplash.,CC BY 4.0 作者:Xosé López-García,圣地亚哥德孔波斯特拉大学和 Cristian Augusto Gonzalez Arias,瓦尔帕莱索天主教大学;当媒体、网络和社交媒体上发布的越来越多的文本由机器编写时,语言会发生什么变化?这个问题[...]

来源:ΑΙhub

作者:Xosé López-García,圣地亚哥德孔波斯特拉大学和克里斯蒂安·奥古斯托·冈萨雷斯·阿里亚斯,瓦尔帕莱索天主教大学;圣地亚哥德孔波斯特拉大学

当媒体、网络和社交媒体上发布的越来越多的文本由机器编写时,语言会发生什么变化?这个问题不仅对新闻业很重要,而且对我们用来理解、描述和讨论现实本身的语言的丰富性也有影响。

从历史上看,媒体一直是公共语言成长和丰富的空间。当然,它并不是语言变革的唯一驱动力,但它是新的或正在出现的词语、短语和描述事实的方式开始在社会中传播的领域之一。

对新闻语言和新词的研究清楚地表明,报纸是创造和传播新词汇的平台,特别是当需要向广大受众报道事件、技术和社会变化时。

然而,如果将大量新闻写作委托给生成式人工智能,那么这一作用将会减弱。大型语言模型 (LLM) 通常通过预测序列中的下一个“标记”或单词来工作。这使他们能够生成流畅且可信的文本,但也使他们倾向于优先考虑统计规律以及常见的、既定的论点和表述。

就其本身而言,这不会降低语言的质量。当这种逻辑主导公共领域的写作时,问题就出现了。

AI 反馈循环

当人工智能系统开始使用人工智能已经生成的文本进行自我训练时,风险就会变得严重。这导致了许多研究所谓的“模型崩溃”,这是一种退化过程,一个模型产生的材料会污染后代的训练数据。

当公共语言变得过于统一时,就会限制新闻业根据新信息调整写作的能力。

一切都没有丢失