几何数据的稳健“Huber 均值”可防止噪声和异常值

在一个由复杂数据驱动的时代,科学家们越来越多地遇到并不完全位于平坦的欧几里得表面上的信息。从 3D 医学扫描到机器人方向和人工智能转换,当今的大部分数据都存在于称为黎曼流形的弯曲几何空间中。准确分析此类数据仍然是一个挑战,特别是当噪声或异常值扭曲结果时。

来源:英国物理学家网首页
新开发的 Huber 均值提供了一种更稳定、更可靠的方法来计算位于弯曲几何空间或黎曼流形上的数据的平均值。通过结合最小二乘 (L2) 和最小绝对偏差 (L₁) 方法的优势,Huber 均值可以抵抗异常值造成的失真,同时保持效率,改进医学成像、机器人和人工智能等领域的数据分析。图片来源:釜山国立大学
胡贝尔平均值

在一个由复杂数据驱动的时代,科学家们越来越多地遇到并不完全位于平坦的欧几里得表面上的信息。从 3D 医学扫描到机器人方向和人工智能转换,当今的大部分数据都存在于称为黎曼流形的弯曲几何空间中。准确分析此类数据仍然是一个挑战,特别是当噪声或异常值扭曲结果时。

为了解决这个问题,釜山国立大学统计系的 Jongmin Lee 教授与首尔国立大学的 Sungkyu Jung 教授合作开发了一种称为 Huber 均值的新统计方法,旨在使弯曲空间的数据分析更加稳健和可靠。该研究于 2025 年 8 月 25 日发表在《皇家统计学会杂志 B 系列:统计方法论》上,通过集成 Huber 损失函数,将效率和异常值抵抗力结合在一个优雅的框架中,引入了经典 Fréchet 均值的稳健泛化。

皇家统计学会期刊 B 系列:统计方法

“我们的研究引入了黎曼流形上经典 Fréchet 均值的稳健概括,”Lee 说。 “这提供了针对异常值的更大稳定性,并提高了几何数据统计分析的可靠性。”

“这种方法可以在非欧几里得环境中进行更稳健的数据分析,这在计算机视觉、医学成像和形状分析等领域具有潜在的应用,”Lee 解释道。

计算机视觉