在新的压缩算法缩小其大小后,在智能手机或笔记本电脑上本地运行大规模 AI 模型可能成为可能——这意味着您的数据永远不会离开您的设备。问题是它可能会在一小时内耗尽您的电池。
*平等贡献者为了在设备上部署机器学习模型,从业者使用压缩算法来缩小和加速模型,同时保持其高质量的输出。实践中压缩的一个关键方面是模型比较,包括跟踪许多压缩实验、识别模型行为的细微变化以及协商复杂的准确性-效率权衡。然而,现有的压缩工具对比较的支持很差,导致在不相交的工具中进行繁琐且有时不完整的分析。为了支持现实世界的比较工作流程,我们...