发表了深Q-Networks(DQN)[Mnih等。,2013年],从其人工智能(AI)冬季唤醒了增强学习(RL),这表明一般基于神经网络的算法可以在一系列复杂的任务中实现专家级的性能。在后来的几年中,深度神经网络的RL导致特工在Go Silver等人中击败了专业人士。[2017],Dota 2 Berner等。[2019],Starcraft 2 [Vinyals等。 ,2019年]以及更多。 因此,在学术界和行业内,对RL研究的公共利益最近都在显着增长。 同时,Openai Gym [Brockman等。 ,2016年]成为第一个广泛采用的普通API。 体育馆是健身房的维护叉子,带来了许多改进和API更新,以使其继续使用开源RL研究。[2019],Starcraft 2 [Vinyals等。,2019年]以及更多。因此,在学术界和行业内,对RL研究的公共利益最近都在显着增长。同时,Openai Gym [Brockman等。,2016年]成为第一个广泛采用的普通API。体育馆是健身房的维护叉子,带来了许多改进和API更新,以使其继续使用开源RL研究。
摘要。不同的几何方法,以对称正定定义(SPD)矩阵的形式分析和处理数据的几何方法对包括计算机视觉,医学成像和机器学习在内的众多领域具有显着的成功应用。此类应用的主要几何范式由与高度和高维度相关的光谱计算相关的一些riemannian几何形状组成。我们提供了一个可扩展的几何框架的途径,以基于半概括的希尔伯特和汤普森的几何形状,基于极端概括的特征值的有效组合,以分析和处理SPD值的数据。我们详细探讨了基于汤普森几何形状的特定地理空间结构,并建立了与该结构相关的几个属性。此外,我们基于这种几何形状来定义SPD矩阵的新型迭代平均值,并证明了它的存在和独特性,用于给定的有限点集合。最后,我们指出并证明了许多所满足此均值的理想属性。
