大型语言模型(LLM)和视觉语言模型(VLM)在各种任务和域中都具有出色的性能。尽管有希望,空间理解和推理(人类认知的基本组成部分)被认为是探索的。我们提出了Spatialeval,这是一种新颖的基准,涵盖了空间推理的各个方面,例如关系理解,导航和计数。我们对竞争语言和视觉语言模型进行了全面评估。我们的发现揭示了文献中忽略的几种违反直觉的见解:(1)空间推理提出了重大挑战,竞争模型可以落后于随机猜测; (2)尽管有其他视觉输入,但与LLM的同行相比,VLM的表现经常不足; (3)当提供文本和视觉信息时,如果提供了足够的文本线索,多模式的语言模型就会减少视觉信息。此外,我们证明了视觉和文本之间的冗余可以显着提高模型性能。我们希望我们的研究能够为多模式模型的发展提供信息,以改善空间智能并通过人类智能进一步缩小差距。我们的代码可在https://github.com/jiayuww/spatialeval上找到。
多年来,地面分布式拒绝服务(DDOS)攻击主要使用了由数千台折衷计算机组成的“僵尸网络”来破坏整个Internet的服务[7]。对空间的攻击似乎是不成比例的,但是计划了数千个卫星星座。因此,值得检查这些星座是否可能代表相同的威胁。他们将以略有不同的原则运作,依靠以下事实:有一个足够密集的星座,总会有一颗卫星靠近受害者卫星和地面之间的界线,而干扰最强。但是,存在相同的攻击矢量:成千上万的近乎相同的系统通过直接(传输到卫星,瞄准远程管理接口)或间接(通过地面站攻击或内部威胁)的方式可能会从地球上几乎任何地方损害。