研究表明,AI搜索引擎在准确性测试中失败

新一代的AI搜索引擎在互联网上引起了批评和怀疑,许多人质疑AI驱动的搜索摘要。批评者认为,技术会产生误导性或不正确的结果,并且用户有可能获得复杂物质的简化图片。但是,最近的一项研究强调了有关AI搜索引擎的准确性的重大挑战,[…]研究表明,AI搜索引擎在AI新闻中首次出现了准确性测试的失败。

来源:AI新闻

新一代的AI搜索引擎在互联网上引起了批评和怀疑,许多人质疑AI驱动的搜索摘要。批评者认为,技术会产生误导性或不正确的结果,并且用户有可能获得复杂物质的简化图片。

AI搜索引擎

然而,最近的一项研究强调了AI搜索引擎准确性的重大挑战,令人震惊的误差率为60%。该数字表明,AI搜索技术的快速引入可能并不伴随着适当的严格测试和精炼,以确保可靠性水平。

研究

调查中包括哪些AI搜索引擎?

该研究包括八个AI搜索引擎,包括Chatgpt搜索,困惑,困惑Pro,Gemini,DeepSeek Search,Grok-2 Search,Grok-3 Search和Copilot。他们测试了每个搜索引擎的准确性,并注意到工具拒绝回答的频率。

尽管准确性值得怀疑,但AI搜索的便利性和速度可能会导致使用增加。这种对潜在不正确信息的依赖可能会对个人和整个社会产生负面影响。

来自数字新闻中心的研究

这项研究表明,哥伦比亚大学的拖曳数字新闻中心进行了明显的60%错误利润率。这项研究的目的是系统地评估AI搜索引擎如何成功地找到和准确地引用来自不同来源的新闻内容。

至于单个AI搜索引擎的性能,有些人表现得更好,而另一些人的表现明显更糟。困惑性和困惑性Pro通常比其他AI工具显示出更好的结果,在该工具中,困惑的总错误率最低37%。

将最新帖子直接发送到您的收件箱