Gemini 与 Copilot:我在 7 项日常任务上测试了人工智能工具,结果相差甚远

微软正在将 Copilot 构建到其拥有的每一款产品中,而谷歌正在将其 Gemini LLM 工具集成到其所有产品中。为了确定哪种工具更好,我提出了七个挑战。

来源:ZDNet | 机器人新闻
Elyse Betters Picaro

关注 ZDNET:将我们添加为 Google 上的首选来源。

将我们添加为首选来源

哈喽,人类同胞们!人工智能聊天机器人很快就会取代我们。他们可以获得比我们微弱的大脑所能容纳的更多的知识,并且他们可以很容易地变成强大的代理,可以轻松处理日常任务。

或者我们是这么被告知的。我一直在尝试 Microsoft Copilot,它使用 OpenAI 的 GPT-5 作为默认的 LLM,但我一直感到失望。偶尔,它会把事情做对,但同样经常——或者看起来如此——它以惊人的方式面对植物。

OpenAI 的 GPT-5 作为默认 LLM 继续失望

另外:停止在所有事情上使用 ChatGPT:我用于研究、编码等的人工智能模型(我避免使用)

停止在所有事情上使用 ChatGPT:我用于研究、编码等的 AI 模型(我避免使用这些模型)

这是否意味着是时候选择新的法学硕士了? Google 的 Gemini 3 最近赢得了好评,因此我决定对其进行测试,与 Copilot 进行正面挑战。

谷歌的 Gemini 3 狂欢 评论

我的目标是确定普通计算机用户(不是开发人员或科学家)将在 PC 或 Mac 上的桌面浏览器中使用的常见任务选择。对于每个场景,我对每个助手执行相同的提示并记下结果。

比赛开始吧。

挑战一:制定旅行行程

获胜者:双子座

当产品经理想要展示他们的超智能人工智能工具时,他们首选的例子就是虚拟旅行社。因此,我的第一个挑战是一个简单的“制定行程”请求,以实现梦想的欧洲假期,参观各种圣诞市场。提示如下:

为我整理一份旅行行程。我想从巴黎出发,然后去五个城市,每个城市都有令人难忘的圣诞市场,每个城市住两晚。最后一站应该是法国斯特拉斯堡。每个城市之间的旅行应乘坐直达列车,不得换乘,且行程长度不得超过四个小时。

挑战 2 - 绘制地图