Gemini 与 Copilot：我在 7 项日常任务上测试了人工智能工具，结果相差甚远 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Gemini 与 Copilot：我在 7 项日常任务上测试了人工智能工具，结果相差甚远

2025年12月8日 16:36 33 Comments

微软正在将 Copilot 构建到其拥有的每一款产品中，而谷歌正在将其 Gemini LLM 工具集成到其所有产品中。为了确定哪种工具更好，我提出了七个挑战。

来源:ZDNet | 机器人新闻

Elyse Betters Picaro

关注 ZDNET：将我们添加为 Google 上的首选来源。

将我们添加为首选来源

哈喽，人类同胞们！人工智能聊天机器人很快就会取代我们。他们可以获得比我们微弱的大脑所能容纳的更多的知识，并且他们可以很容易地变成强大的代理，可以轻松处理日常任务。

或者我们是这么被告知的。我一直在尝试 Microsoft Copilot，它使用 OpenAI 的 GPT-5 作为默认的 LLM，但我一直感到失望。偶尔，它会把事情做对，但同样经常——或者看起来如此——它以惊人的方式面对植物。

OpenAI 的 GPT-5 作为默认 LLM 继续失望

另外：停止在所有事情上使用 ChatGPT：我用于研究、编码等的人工智能模型（我避免使用）

停止在所有事情上使用 ChatGPT：我用于研究、编码等的 AI 模型（我避免使用这些模型）

这是否意味着是时候选择新的法学硕士了？ Google 的 Gemini 3 最近赢得了好评，因此我决定对其进行测试，与 Copilot 进行正面挑战。

谷歌的 Gemini 3 狂欢评论

我的目标是确定普通计算机用户（不是开发人员或科学家）将在 PC 或 Mac 上的桌面浏览器中使用的常见任务选择。对于每个场景，我对每个助手执行相同的提示并记下结果。

比赛开始吧。

获胜者：双子座

当产品经理想要展示他们的超智能人工智能工具时，他们首选的例子就是虚拟旅行社。因此，我的第一个挑战是一个简单的“制定行程”请求，以实现梦想的欧洲假期，参观各种圣诞市场。提示如下：

为我整理一份旅行行程。我想从巴黎出发，然后去五个城市，每个城市都有令人难忘的圣诞市场，每个城市住两晚。最后一站应该是法国斯特拉斯堡。每个城市之间的旅行应乘坐直达列车，不得换乘，且行程长度不得超过四个小时。

行程长度绘制地图目标不得 ChatGPT 计算机旅行 OpenAI 相同的 LLM 人工智能选择使用旅行社模型首选意味着 Copilot 强大的科学家开发人员微弱的使用的 Google 更多的行程 Gemini GPT 每个机器人简单的挑战产品经理