摘要 — 在机器对机器 (M2M) 传输环境中,非常需要使用有损压缩来减少传输的信息量。然而,常用的图像压缩方法是为人类感知而设计的,而不是为人工智能 (AI) 算法的性能而设计的。众所周知,这些压缩失真会影响许多基于深度学习的架构在多个计算机视觉任务上的表现。在本文中,我们专注于分类任务,并提出了一种名为专家训练的新方法,以增强卷积神经网络 (CNN) 对压缩失真的弹性。我们在 ImageNet 数据集上使用 MnasNet 和 ResNet50 架构验证了我们的方法,以抵抗三种常用方法 (JPEG、J2K 和 BPG) 引入的图像压缩失真。结果表明,使用所提出的专家训练方法,这两种架构对测试的编码伪影具有更好的鲁棒性。我们的代码可在 https://github.com/albmarie/expert training 上公开获取。索引术语 — 人工智能 (AI)、图像编码、机器对机器 (M2M)
尽管过去几十年来信息技术、微电子、人工传感和信息处理领域取得了令人瞩目的进步,但实际系统在处理现实任务时仍然远不如生物系统有效。这种分析导致了神经形态工程领域的出现,特别是基于事件的传感,旨在构建基于硅的传感和计算设备,模仿生物系统获取和处理信息的方式。与传统图像传感器不同,EB 传感器不对所有像素使用通用采样率(称为帧速率),而是每个像素连续跟踪入射光量并在变化时异步采样信号。这种获取稀疏数据的高效方式、高时间分辨率以及对不受控制的照明条件的鲁棒性(具有高动态范围)是 EB 传感过程的特点,使 EB 成像对众多应用具有吸引力,例如工业自动化、过程监控、监控、物联网、AR/VR、汽车和移动环境。
将使用双刺激连续质量量表 (DSCQS) 方法,受试者并排观看原始图像和受损解码图像,并在连续量表中对两者进行评分。该量表分为五个相等的长度,与正常的 ITU-R 五点质量量表相对应,即优秀、良好、一般、较差和差。该方法需要评估每个测试图像的原始版本和受损版本。观察者不知道哪一个是参考图像,并且参考图像的位置以伪随机顺序更改。受试者通过在垂直刻度上插入标记来评估原始图像和解码图像的整体质量。垂直刻度成对打印,以适应每个测试图片的双重呈现。