详细内容或原文请订阅后点击阅览
Gemini 与 Copilot:我在 7 项日常任务上测试了人工智能工具,结果相差甚远
微软正在将 Copilot 构建到其拥有的每一款产品中,而谷歌正在将其 Gemini LLM 工具集成到其所有产品中。为了确定哪种工具更好,我提出了七个挑战。
来源:ZDNet | 机器人新闻关注 ZDNET:将我们添加为 Google 上的首选来源。
将我们添加为首选来源哈喽,人类同胞们!人工智能聊天机器人很快就会取代我们。他们可以获得比我们微弱的大脑所能容纳的更多的知识,并且他们可以很容易地变成强大的代理,可以轻松处理日常任务。
或者我们是这么被告知的。我一直在尝试 Microsoft Copilot,它使用 OpenAI 的 GPT-5 作为默认的 LLM,但我一直感到失望。偶尔,它会把事情做对,但同样经常——或者看起来如此——它以惊人的方式面对植物。
OpenAI 的 GPT-5 作为默认 LLM 继续失望另外:停止在所有事情上使用 ChatGPT:我用于研究、编码等的人工智能模型(我避免使用)
停止在所有事情上使用 ChatGPT:我用于研究、编码等的 AI 模型(我避免使用这些模型)这是否意味着是时候选择新的法学硕士了? Google 的 Gemini 3 最近赢得了好评,因此我决定对其进行测试,与 Copilot 进行正面挑战。
谷歌的 Gemini 3 狂欢 评论我的目标是确定普通计算机用户(不是开发人员或科学家)将在 PC 或 Mac 上的桌面浏览器中使用的常见任务选择。对于每个场景,我对每个助手执行相同的提示并记下结果。
比赛开始吧。
挑战一:制定旅行行程
获胜者:双子座
当产品经理想要展示他们的超智能人工智能工具时,他们首选的例子就是虚拟旅行社。因此,我的第一个挑战是一个简单的“制定行程”请求,以实现梦想的欧洲假期,参观各种圣诞市场。提示如下:
为我整理一份旅行行程。我想从巴黎出发,然后去五个城市,每个城市都有令人难忘的圣诞市场,每个城市住两晚。最后一站应该是法国斯特拉斯堡。每个城市之间的旅行应乘坐直达列车,不得换乘,且行程长度不得超过四个小时。
