详细内容或原文请订阅后点击阅览
人工智能正在使新闻语言变得更加重复和可预测——这对我们所有人来说都是一个问题
Markus Winkler / Unsplash.,CC BY 4.0 作者:Xosé López-García,圣地亚哥德孔波斯特拉大学和 Cristian Augusto Gonzalez Arias,瓦尔帕莱索天主教大学;当媒体、网络和社交媒体上发布的越来越多的文本由机器编写时,语言会发生什么变化?这个问题[...]
来源:ΑΙhub作者:Xosé López-García,圣地亚哥德孔波斯特拉大学和克里斯蒂安·奥古斯托·冈萨雷斯·阿里亚斯,瓦尔帕莱索天主教大学;圣地亚哥德孔波斯特拉大学
当媒体、网络和社交媒体上发布的越来越多的文本由机器编写时,语言会发生什么变化?这个问题不仅对新闻业很重要,而且对我们用来理解、描述和讨论现实本身的语言的丰富性也有影响。
从历史上看,媒体一直是公共语言成长和丰富的空间。当然,它并不是语言变革的唯一驱动力,但它是新的或正在出现的词语、短语和描述事实的方式开始在社会中传播的领域之一。
对新闻语言和新词的研究清楚地表明,报纸是创造和传播新词汇的平台,特别是当需要向广大受众报道事件、技术和社会变化时。
然而,如果将大量新闻写作委托给生成式人工智能,那么这一作用将会减弱。大型语言模型 (LLM) 通常通过预测序列中的下一个“标记”或单词来工作。这使他们能够生成流畅且可信的文本,但也使他们倾向于优先考虑统计规律以及常见的、既定的论点和表述。
就其本身而言,这不会降低语言的质量。当这种逻辑主导公共领域的写作时,问题就出现了。
AI 反馈循环
当人工智能系统开始使用人工智能已经生成的文本进行自我训练时,风险就会变得严重。这导致了许多研究所谓的“模型崩溃”,这是一种退化过程,一个模型产生的材料会污染后代的训练数据。
当公共语言变得过于统一时,就会限制新闻业根据新信息调整写作的能力。
