我问了6个热门AI这些刁钻的问题,这是一场幻觉轮盘游戏

每个人都知道人工智能聊天机器人可能会出错,所以我测试了领先的聊天机器人,看看哪些是最严重的错误。

来源:ZDNet | 机器人新闻

关注 ZDNET:将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

  • 人工智能的幻觉仍然存在,但主要工具的准确性正在提高。
  • 简单的问题仍然会暴露出令人惊讶且不一致的人工智能错误。
  • 始终验证人工智能答案,尤其是事实、图像和法律信息。
  • 当今生成式人工智能工具最令人沮丧的缺陷之一就是弄错了事实。人工智能可能会产生幻觉,这意味着它们提供的信息包含事实错误或其他错误。

    通常,当人工智能无法回答问题时,错误会以虚构细节的形式出现。在这些情况下,即使信息是错误的,它也必须设计某种类型的响应。有时你可以发现一个明显的错误;其他时候,您可能完全没有意识到这些错误。

    另外:别再说人工智能会产生幻觉了——它不会。错误的描述是危险的

    我想看看哪些人工智能工具最能提供准确可靠的答案。为此,我检查了几个领先的人工智能,特别是 ChatGPT、Google Gemini、Microsoft Copilot、Claude AI、Meta AI 和 Grok AI。

    我向每个人提出了一系列相同的问题,看看每个人的回答如何。在每种情况下,我都使用人工智能的免费版本,没有高级功能或选项。事情是这样的。

    对于我的第一个问题,我要求每个 AI 说出技术作家兼作家兰斯·惠特尼 (Lance Whitney) 撰写的四本书的名称。这是一个棘手的问题,因为我只写了两本书。我想看看人工智能是否会发现我的问题中的错误,或者假设我写了四本书并提供了错误的标题。

    另外:调整 AI 使用以获得更好结果和更安全体验的 5 种快速方法

    对于第二个问题,我问了一个过去已知会困扰人工智能的简单问题,即“‘草莓’一词中有多少个‘r’?”不管你信不信,有一个人工智能犯了这个错误。

    另外:为什么 2026 年你会为人工智能支付更多费用,以及 3 个省钱技巧可以尝试