将图像压缩到视觉变压器的补丁__

将图像压缩到视觉变压器的补丁

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

将图像压缩到视觉变压器的补丁

¥ 1.0

热度

Vision Transformer（VIT）在计算机视觉领域取得了重大步骤。然而，随着模型的深度和输入图像的重新分配增加，与培训和运行的VIT模型相关的计算成本急剧上升。本文提出了一个基于CNN和Vision Trans-trans-trans的混合模型，称为CI2P-VIT。该模型包含一个称为CI2P的模块，该模块利用Compressai编码来压缩图像，然后通过一系列连接生成一系列贴片。CI2P可以替换VIT模型中的贴片嵌入组件，从而无缝集成到现有的VIT模型中。与VIT-B/16相比，CI2P-VIT具有减少到原始四分之一的自我发项层的斑块输入数量。此设计不仅显着降低了VIT模型的计算成本，而且还通过引入CNN的电感偏置特性有效地提高了模型的准确性。VIT模型的精度显着提高。在Animal-10数据集的地面上接受训练时，CI2P-VIT的准确率为92.37％，比VIT-B/16基线提高了3.3％。此外，该模型的计算操作以每秒浮点操作（FLOPS）测量，减少了63.35％，并且在相同的硬件配置上的训练速度增加了2倍。

添加pdf代下载 VIP点击下载文件

将图像压缩到视觉变压器的补丁

主要关键词

训练输入提高取得现有的模块速度增加输入图像模型的一系列操作 Vision CNN 硬件配置四分之一压缩图像 CI2P 计算成本运行的 VIT 相同的准确性贴片模型相关 trans 计算机 16 急剧上升相关的数据集模型领域增加

将图像压缩到视觉变压器的补丁PDF文件第1页

将图像压缩到视觉变压器的补丁PDF文件第2页

将图像压缩到视觉变压器的补丁PDF文件第3页

将图像压缩到视觉变压器的补丁PDF文件第4页

将图像压缩到视觉变压器的补丁PDF文件第5页

可下载资源数量

已经购买

下载数量：1

将图像压缩到视觉变压器的补丁

将图像压缩到视觉变压器的补丁

相关文件推荐

基于视觉变压器的图像分类

卷积神经网络与视觉变压器

关于有效视觉变压器的调查

用视觉变压器缩放离线Q学习

变量：可变图像大小的视觉变压器

IH-ViT：基于视觉变压器的集成电路问世

视觉

视觉

视觉调优

fvit：带有Gabor滤波器的焦点视觉变压器

层次视觉变压器用于心脏射血分数估计

使用视觉和语言变压器模型的视频摘要

3D计算机视觉

一种用于人类感知和多个视觉任务的统一图像压缩方法

视觉排序算法

艺术/视觉艺术

视觉治疗

emgtfnet：模糊视觉变压器解码上限semg信号识别

计算机视觉

vit-ae ++：改进自我视觉变压器自动编码器...

视觉零行动计划

视觉治疗

视觉策略

视觉策略

视觉任务计划

计算机视觉

计算机视觉

什么是视觉策略？

视觉人工智能

AI 视觉，更早行动

XiaoMi-AI