Text-Conditional JEPA for Learning Semantically Rich Visual Representations
基于图像的联合嵌入预测架构 (I-JEPA) 提供了一种通过屏蔽特征预测进行视觉自监督学习的有前途的方法。然而,由于屏蔽位置固有的视觉不确定性,特征预测仍然具有挑战性,并且可能无法学习语义表示。在这项工作中,我们提出了文本条件 JEPA(TC-JEPA),它使用图像标题来减少预测的不确定性。具体来说,我们使用细粒度文本调节器来调整预测的补丁特征,该调节器计算输入文本标记上的稀疏交叉注意力。有了这样的……
多模式代理的真正空间智能超越了低级几何感知,从了解事物的位置发展到理解它们的用途。虽然 VSI-Bench 等现有基准可以有效评估这一基础几何阶段,但它们未能探索基础智能所必需的高阶认知能力。为了弥补这一差距,我们引入了空间功能智能基准 (SFI-Bench),这是一个基于视频的基准,包含来自多样化、以自我为中心的室内视频扫描的 1700 多个问题。 SFI-Bench 旨在...
使用 UCE 系统发育学和形态学解决 Lechia Żabka, 1985(Araneae:Salticidae)的部落分类了解生命之树内的浅层关系对于解决分类学不确定性和阐明进化过程至关重要。尽管跳蛛的深层系统发育取得了重大进展,但许多浅层关系仍然知之甚少,例如广泛分布于东南亚的Lechia Żabka属,1985年。该属的系统发育位置尚不确定,而且由于缺乏对其模式种Lechia squamata Żabka,1985年的正式雄性描述,雪上加霜。在这项研究中,我们首次对跳蛛的雄性进行正式描述。 L. squamata,改进了该属的形态学诊断,并提出了两个新的同义词:Phintelloides
USAG Bavaria shines bright at 65th annual IMCOM TOPPERs Awards
德国克莱卡塞尔 — 美国陆军驻巴伐利亚驻地社区成员在今年的 TOPPERs 颁奖典礼上占据了中心位置。
Digital Surveillance Is Becoming the New Form of Government Power
涉及国土安全部要求谷歌交出与加拿大公民相关的数据的最新爆料表明,各国政府正在将数字监控权力超越传统的法律和国界。据《连线》报道,国土安全部根据 1930 年关税法使用“海关传票”来索取位置记录、帐户 [...]