最新的性能。虽然鉴定的视觉模型(例如对比语言图像预训练(剪辑))通过在共同空间中学习视觉语言概念来实现有希望的零射击性能,但它们之间的自然层次结构仍然没有探索。在这项工作中,我们提出了Poinclip:基于庞加利的几何形状模型,该模型研究了两者之间的层次关系,以学习联合文本图像表示。我们将Poinclip的性能与夹模型的性能进行比较,以进行零拍图像分类和检索任务,以证明所提出的方法的功效。
基线。我们主要与 CLIP(Radford 等人,2021 年)进行比较,后者在欧几里得空间中的单位超球面上嵌入图像和文本。CLIP 使用 4 亿个图像-文本对的私有数据集进行训练。一些后续工作重新实现了 CLIP 并使用可公开访问的数据集,如 YFCC(Thomee 等人,2016 年)、概念标题(Changpinyo 等人,2021 年;Sharma 等人,2018 年)和 LAION(Schuhmann 等人,2021 年;2022 年);值得注意的例子是 OpenCLIP(Ilharco 等人,2021 年)、SLIP(Mu 等人,2022 年)、DeCLIP(Li 等人,2022 年)和 FILIP(Yao 等人,2022 年)。我们开发了 CLIP 基线并使用单个公共数据集 RedCaps(Desai 等人,2021 年)对其进行训练,以便于重现。我们最小的模型使用 8 × V100 GPU 在不到一天的时间内进行训练,并且明显优于最近使用 YFCC(Mu 等人,2022 年)的 CLIP 重新实现。
随着机器学习技术和应用的爆炸性增长,具有转移功率的新范式和模型正在丰富该领域。近年来最引人注目的趋势之一是里曼尼亚几何学和谎言群体理论的显着意义的迅速崛起。根本原因是数据的复杂性上升,激发了更复杂的方法,从而导致广泛认识到大量数据集表现出内在的曲率。换句话说,许多数据集自然代表或忠实地嵌入了非欧几里得空间中。这种明显的例子是机器人技术中的旋转运动。n维空间中的旋转构成谎言组,并且没有矢量空间的结构。但是,非欧盟数据的显着性远远超出了这个特定示例。略有明显,但无处不在的是双曲几何形状中的数据表示。被广泛接受的是,任何具有某些(可能是隐藏的)层次结构的数据集自然地嵌入具有恒定负曲率的Riemannian歧管中[18,19,15]。数据激发系统方法的各种非欧亚人表示的最新进展,从而引起了新兴领域,名为“几何深度学习” [8]。
现实世界的视觉数据具有固有的层次结构,可以在双曲线空间中有效地代表。双曲神经网络(HNN)是在此类空间中学习特征表示的有前途的方法。然而,计算机视觉中的当前HNN依赖于欧几里得主链,并且仅在任务头中的双曲线空间唯一的项目功能,从而限制了它们充分利用双曲线几何的好处的能力。为了解决这个问题,我们提出了HCNN,这是一种全均匀的卷积神经网络(CNN),专为计算机视觉任务而设计。基于Lorentz模型,我们概括了CNN的基本组合,并提出了卷积层,批准归一化和多项式逻辑回归的新型公式。对标准视频任务的实验证明了在混合和完全双曲的设置中我们的HCNN框架的有希望的性能。总体而言,我们认为我们的贡献为开发更强大的HNN提供了基础,这些HNN可以更好地代表图像数据中发现的复杂结构。我们的代码可在https://github.com/kschwethelm/hyperboliccv上公开获取。
在Riemannian几何形状中,双曲几何空间(具有负曲率)可以直观地理解为连续的树和球形几何空间(具有正曲率),用于建模周期性图。
我们提供了一种新方法,用于在给定的地理数据集中检测多边形组并为每个组计算代表性多边形。此任务与MAP概括相关,其目的是从给定的地图中得出较少详细的地图。按照经典的方法,我们通过将输入多边形与一组三角形合并,从一个约束的Delaunay三角剖分中选择输入多边形,来定义输出多边形。我们方法的创新是通过解决双晶格优化问题来计算三角形的选择。一方面,我们旨在最大程度地减少输出多边形的总面积,但另一方面,我们的目的是最大程度地减少其总周长。我们将这两个目标结合在一起,并研究自然出现的两个计算问题。在第一个问题中,平衡两个目标的参数是固定的,目的是计算单个最佳解决方案。在第二个问题中,目的是为参数的每个可能值计算包含最佳解决方案的集合。我们基于计算适当定义的图表的最小切割而提出了这些问题的有效算法。此外,我们展示了如何使用几乎没有解决方案近似第二个问题的结果集。在实验评估中,我们最终表明该方法能够从与参考解决方案相似的足迹中得出结算区域。
最新的表示学习研究表明,层次数据将自己带入双曲线空间中的低维和高度信息的表示。但是,即使双曲线嵌入在图像识别方面也收集了,它们的优化也容易出现数值障碍。此外,与传统的Eu-Clidean特征相比,尚不清楚哪种应用将受益于双曲线的隐性偏见最大。在本文中,我们专注于原型双曲神经网络。尤其是,双曲线嵌入的趋势会在高维度收敛到庞加尔e球的边界,并且对这对几乎没有的分类具有影响。我们表明,在常见的双曲半径上获得双曲线嵌入的最佳射击效果。与先前的基准结果相反,我们证明了配备有欧几里德指标的固定radius编码器可以实现更好的性能,而与嵌入式维度无关。
决策通常需要平衡立即满足与长期利益。在增强学习(RL)中,这种平衡行为受到时间差异的影响,该行为量化了未来奖励的贬值。事先的研究表明,与RL中使用的常规指数折扣相比,人类决策与双曲线折扣更加与双曲线折扣保持一致。随着人造代理变得更加先进和普遍,尤其是在与人类的多代理设置中,对适当的折扣模型的需求变得至关重要。尽管已经提出了单质学习的双曲线折扣,但其在多代理增强学习中的潜力(MARL)仍未开发。我们在MAL中介绍和制定双曲线折扣,在各种框架上建立理论和实践基础,包括独立学习,集中策略差异和价值分解方法。我们评估了多余的合作任务的双曲线折扣,将其与指数折扣基线进行了比较。我们的结果表明,双曲线折扣在60%的方案中获得了更高的回报,并且在95%的任务中以指数折扣的速度表现出色,并在稀疏奖励和协调密集的环境方面得到了显着改善。这项工作为高级多代理系统开发的强大决策过程开辟了新的途径。
sobolev规律性:沿变量x∈T沿h m中统一大小的某些初始数据生成了室大小Δ -1后t =δ> 0任意小(cf.定理1.1)。在[8]中,我们证明系统(1.1)在沿x∈T的规律性Gevrey- 3类时,系统(1.1)在局部实现。在这项工作中,我们旨在在初始数据为gevrey-class m,m> 3。其次,我们的目标是在围绕非单调剪切流线性线性时,就原始prandtl方程的不良性质提出一些评论(参见系统(1.5))。G´erard-Varet和Dormy [12]进行的开创性工作表明,线性化的Prandtl方程在Sobolev空间内不适合。他们构建了显示秩序√
双曲线无线电定位:该概念是在第二次世界大战期间发展起来的,其基础是测量已知位置的(主从)发射器对广播的信号的相位或到达时间的差异。由差异产生的定位线 (LOP) 是双曲线。两条双曲线(来自两对发射器)的交点决定了导航员的位置。双曲线无线电定位系统的精度在空间上是可变的,取决于三个因素:LOP 测量不确定性、双曲线 LOP 的扇出(扩展因子)(取决于主从之间与基线的距离)以及 LOP 之间的相交角(见图 1)。表 1 总结了用于收集 GEBCO 数据的双曲线系统的特征。