当这个词是“麻雀”时:成群的鸟儿教会人工智能冷静

已经开发出一种方法来对抗在总结大型文本时对大型语言模型的幻觉。

来源:OSP网站大数据新闻

来源:Jimmy Palma Gil (CC BY-SA 2.0)

AI聊天机器人的主要缺点之一是在编写长文档摘要时错误信息的比例很大:如果长文本中有大量偏离主题的信息或重复,模型的性能就会下降,它会“失去线索”,添加不相关的内容或根本不在源中的信息。

为了帮助 AI 专注于主题,纽约大学的科学家借鉴了鸟群的原理,实现了一个文本预处理框架:它们不会散开,因为每只鸟都靠近邻居,与它们朝同一方向飞行,并保持距离。

在框架内,每个句子有条件地对应于一只“鸟”。系统根据提案对主题的代表性、重要性和相关性对提案进行评级。排名靠前的句子使用类似于鸟群中的鸟的规则进行聚类,创建几组具有相似含义的句子。在每个集群中,通过评级选出一个领导者,这些领导提案被传输给AI代理,AI代理生成摘要。

对 9000 个文档的测试表明,使用该框架时,具有 AI 的聊天机器人比不使用该框架时生成的摘要更准确。