实际学习图像压缩中重要的是什么 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

实际学习图像压缩中重要的是什么

2026年5月7日 00:00 33 Comments

来源:Apple机器学习研究

学习编解码器相对于硬编码的传统编解码器的主要区别之一是它们能够直接优化以吸引人类视觉系统。尽管有这种潜力，但一种可感知且实用的图像编解码器尚未被提出。在这项工作中，我们的目标是缩小这一差距。我们对控制实际学习图像编解码器设计的关键建模选择进行了全面的研究，并针对感知质量和运行时间进行了联合优化 - 包括在消融中的几种新技术。然后，我们对数百万个主干配置执行性能感知神经架构搜索，以识别实现目标设备运行时间的模型，同时最大化感知指标捕获的压缩性能。我们结合各种优化来构建新的编解码器，从而显着改善速度和感知质量之间的权衡。基于严格的主观用户研究，与 AV1、AV2、VVC、ECM 和 JPEG-AI 相比，它的比特率节省了 2.3–3 倍，与最先进的编解码器替代方案相比，比特率节省了 20–40%。与此同时，在 iPhone 17 Pro Max 上，它对 12MP 图像的编码速度可达 230 毫秒，解码速度为 150 毫秒——比在 V100 GPU 上运行的大多数基于 ML 的顶级编解码器还要快。

运行时间严格的压缩性设计的工作中图像时间的编解码器编码的毫秒最大化解码器感知控制先进的比特率质量性能速度节省实用的运行的视觉系统学习优化进行全面的替代方案实现目标

实际学习图像压缩中重要的是什么

其他外部链接

Tags

XiaoMi-AI