Breaking Down Video LLM Benchmarks: Knowledge, Spatial Perception, or True Temporal Understanding?
本文在 NeurIPS 2025 的 Evaluating the Evolving LLM Lifecycle Workshop 上被接受。现有的视频理解基准通常将基于知识的问题和纯粹基于图像的问题混为一谈,而不是明确隔离模型的时间推理能力,而这是区分视频理解与其他模态的关键方面。我们发现了两个主要限制,这些限制掩盖了较高的分数是否真正表明对视频中的动态内容有更强的理解:(1)强大的语言先验,模型可以在不观看视频的情况下回答问题;和(2)...
Canada’s “edugration” model comes under scrutiny
专家在议会国际学生委员会会议上表示,加拿大必须“紧急恢复”公众对移民和高等教育的信心——这两个相互关联的政策文件不能混为一谈。加拿大“教育”模式受到审查的消息首先出现在《PIE News》上。
萨温节,万圣节之夜。万圣节,万圣节。虽然名字变了,但世界对这一充满惊悚和恐惧的日子的迷恋从未动摇。除了它也一直与收获、农业和食物有关。将食物和鬼魂混为一谈似乎很奇怪,但从文化的角度来说,这就是万圣节;文化和信仰的令人困惑的混搭。这其实是一件好事。这证明了创建一个由人们组成的大熔炉,他们成为一个社区,这比没有人愿意将外部群体纳入自己的习俗的沙拉碗更好。阅读更多