thinking关键词检索结果

ChatGPT 首次解决了未经证实的几何数学问题

For the First Time, ChatGPT Has Solved an Unproven Math Problem in Geometry

新研究发现ChatGPT-5.2可以生成原始数学证明,引入“vibe-proving”作为一种新的人工智能推理方法。人工智能加速了发现,但人工验证仍然是必要的。 VUB 数据分析实验室的研究人员报告称,商业语言模型可以产生原始的数学证明。在他们的研究中,团队表明 OpenAI 的大型语言模型 ChatGPT-5.2 (Thinking) [...]

我尝试了 GPT-5.4,大多数答案都非常好 - 但有一些让我担心

I tried GPT-5.4, and most answers were really good - but a few had me concerned

OpenAI 声称 GPT-5.4 Thinking 可以完成专业任务,但我不太确定这是否完全准确。