摘要。机器和人类视力(ICMH)的图像压缩近年来引起了人们的关注。现有的ICMH方法受到高训练和存储开销的限制,这是由于特定于任务的网络设计的大量设计。为了解决此问题,在本文中,我们为ICMH(名为Adapt-ICMH)开发了一种新颖的基于轻量级适配器的调整框架,可以更好地平衡任务性能和比特率与减少的开销。We propose a spatial-frequency modulation adapter (SFMA) that simultaneously eliminates non-semantic redundancy with a spatial modulation adapter, and enhances task-relevant frequency com- ponents and suppresses task-irrelevant frequency components with a fre- quency modulation adapter.所提出的适配器是插件播放的,并且与几乎所有现有的学到的图像压缩模型兼容,而不会损害预训练模型的性能。实验表明,适应性ICMH始终在各种机器视觉任务上的现有ICMH框架较少,并且较少的微调参数和降低的计算复杂性。代码将在https://github.com/qingshi9974/eccv2024-adpaticmh上发布。
迈克尔·麦凯(Michael McKay)教授最初接受了辐射肿瘤学的培训,然后从悉尼大学获得了博士学位,并从新南威尔士大学获得了医学博士学位。接下来,他在鹿特丹的细胞生物学和遗传学系接受了国际人类的癌症遗传学博士后研究金。在这里,他发现了几个人类基因,这些基因参与了人体对辐射的反应,这是他在澳大利亚墨尔本的Peter MacCallum癌症中心的转化研究平台的核心。他是该机构DNA维修实验室的负责人,已有13年了,在此期间,他建立并指导了Peter Mac家族癌症中心。后来他在澳大利亚国立大学和皇家堪培拉医院工作,在那里他担任辐射肿瘤学和分子医学教授的职位。 此外,他是悉尼大学的临床教授,目前是塔斯马尼亚大学的名誉教授。后来他在澳大利亚国立大学和皇家堪培拉医院工作,在那里他担任辐射肿瘤学和分子医学教授的职位。此外,他是悉尼大学的临床教授,目前是塔斯马尼亚大学的名誉教授。
近年来,量子图像处理在图像处理领域引起了广泛关注,因为它有机会将海量图像数据放入量子希尔伯特空间。希尔伯特空间或欧几里得空间具有无限维度,可以更快地定位和处理图像数据。此外,多种类型的研究表明,量子过程的计算时间比传统计算机更快。在量子域中编码和压缩图像仍然是一个具有挑战性的问题。从文献调查中,我们提出了一种 DCT-EFRQI(直接余弦变换量子图像的高效灵活表示)算法来有效地表示和压缩灰度图像,从而节省计算时间并最大限度地降低准备的复杂性。这项工作旨在使用 DCT(离散余弦变换)和 EFRQI(量子图像的高效灵活表示)方法在量子计算机中表示和压缩各种灰度图像大小。使用 Quirk 模拟工具设计相应的量子图像电路。由于量子比特数的限制,总共使用 16 个量子比特来表示灰度图像的系数及其位置。其中,8 个量子比特用于映射系数值,其余量子比特用于生成相应系数的 XY 坐标位置。理论分析和实验结果表明,与 DCT-GQIR、DWT-GQIR 和 DWT-EFRQI 相比,所提出的 DCT-EFRQI 方案在 PSNR(峰值信噪比)和比特率方面提供了更好的表示和压缩。
我们考虑深度神经网络 (DNN) 在具有挑战性的一次性/后训练环境中的模型压缩问题,在该环境中,我们获得了一个经过精确训练的模型,并且必须仅基于少量校准输入数据对其进行压缩,而无需进行任何重新训练。鉴于新兴的软件和硬件支持通过加速剪枝和/或量化来执行压缩模型,这个问题变得很普遍,并且已经针对这两种压缩方法分别提出了性能良好的解决方案。在本文中,我们介绍了一种新的压缩框架,该框架在统一的环境中涵盖权重剪枝和量化,具有时间和空间效率,并且大大提高了现有后训练方法的实际性能。在技术层面,我们的方法基于 [LeCun、Denker 和 Solla,1990] 的经典最佳脑外科医生 (OBS) 框架的精确和高效实现,该框架扩展到还涵盖现代 DNN 规模的权重量化。从实际角度来看,我们的实验结果表明,它可以显著改善现有后训练方法的压缩-准确度权衡,并且可以在后训练环境中实现修剪和量化的准确复合应用。
摘要 - 深度神经网络在大多数计算机视觉问题中一直始终代表最新技术。在这些情况下,较大且更复杂的模型表现出优于较小架构的性能,尤其是在接受大量代表性数据培训时。随着视觉变压器(VIT)架构的最新采用和广告卷积神经网络(CNN),领先的主链体系结构的参数总数从2012年的6200万参数增加到ALEXNET的6200万参数,到2024年AIM-7B的2024年参数。因此,部署这样的深度体系结构在处理和运行时限制的环境中面临挑战,尤其是在嵌入式系统中。本文涵盖了用于计算机视觉任务的主要模型压缩技术,使现代模型可以用于嵌入式系统中。我们介绍了压缩亚地区的特征,比较不同的方法,并讨论如何在各种嵌入式设备上分析它时选择最佳技术和预期变化。我们还共享代码,以协助研究人员和新从业人员克服每个子区域的初始实施挑战,并为模型压缩带来现有趋势。压缩模型的案例研究可在https://github.com/venturusbr/cv-model-compression上获得。索引术语 - 安装系统,模型压缩,知识蒸馏,网络修剪,网络量化
摘要:在自主驾驶技术不断发展的景观中,光检测和范围(LIDAR)传感器已成为增强环境感知的关键仪器。他们可以在车辆周围提供精确的,高分辨率的实时3D表示,以及在弱光条件下进行远程测量的能力。但是,这些优势是以传感器生成的大量数据为代价的,导致了传输,处理和存储操作的几个挑战,目前可以通过对点云中使用数据压缩技术来减轻这些挑战。本文介绍了用于压缩汽车LIDAR传感器的点云数据的现有方法的调查。它提出了一种全面的分类法,将这些方法分为四个主要群体,并在几个重要指标中进行比较和讨论。
Melanie McLeod 博士,药剂师和独立处方员 Melanie 从事药剂师工作的时间比她愿意承认的要长,过去 14 年来,她一直在初级保健领域担任独立处方员。Melanie 参与慢性病管理评估,包括心力衰竭患者,并与社区心力衰竭团队保持密切联系。Melanie 将主持一场会议,探讨肿胀和心力衰竭背景下的药物管理,带来她作为药剂师和独立处方员的独特视角。我们很高兴介绍 Melanie 作为 Accelerate Academy 助理教育者团队的一员。
纳米孔测序是基因组学中越来越重要的工具。尽管该领域进展迅速,但大数据量和计算瓶颈仍然是主要挑战。在这里,我们介绍了一种新的数据压缩策略 ex-zd,它有助于解决纳米孔实验期间产生的大量原始信号数据。Ex-zd 既包含无损压缩方法,其性能略优于所有当前的纳米孔信号数据压缩方法,也包含“有损”方法,可用于实现显着的额外节省。后者通过减少用于编码信号数据的位数来工作。我们表明,牛津纳米孔技术公司 (ONT) 的仪器生成的信号数据中的三个最低有效位主要编码噪声。它们的删除将文件大小减少了一半,而不会影响下游分析,包括碱基调用和 DNA 甲基化检测。Ex-zd 压缩可在单个 ONT 测序实验中节省数百 GB,从而提高纳米孔测序的可扩展性、可移植性和可访问性。
我们考虑在具有挑战性的一声/训练后设置中,深度神经网络(DNN)的模型压缩问题,在该设置中,我们将获得一个准确的训练有素的模型,并且必须仅基于少量校准输入数据而无需进行任何重新训练。鉴于新兴软件和硬件支持,该问题已变得很流行,以通过加速进行修剪和/或量化来执行模型,并且已经针对两种压缩方法独立提出了良好的表现解决方案。在本文中,我们引入了一个新的压缩框架,该框架涵盖了在统一的环境中涵盖重量修剪和量化的,这是时间和空间效果,并且在现有后训练方法的实际性能上大大提高。在技术层面上,我们的方法基于[Lecun,Denker和Solla,1990]的经典最佳脑外科医生(OBS)框架的精确而有效的实现,以涵盖现代DNNS规模的体重量化。从实际的角度来看,我们的实验结果表明,它可以在现有训练后方法的压缩准确性权衡方面显着改善,并且它可以在培训后环境中启用修剪和量化的准确复合应用。