这项研究通过使用视觉变压器(VIT)体系结构引入了一种创新的图像分类方法。实际上,视力传输(VIT)已成为用于图像分析任务的卷积神经网络(CNN)的有前途的选择,提供可扩展性和提高的性能。Vision Transformer VIT模型能够捕获图像元素之间的全局规定和链接。这导致了特征表示的增强。当VIT模型在不同模型上训练时,它表现出在不同的IMEGE类别中的强大分类功能。VIT直接处理图像贴片的能力而不依赖空间层次结构,简化了分类过程并证明了计算效率。在这项研究中,我们使用TensorFlow提出了Python的启动,以采用(VIT)模型进行图像分类。将使用四类动物,例如(牛,狗,马和绵羊),用于分类。(VIT)模型用于从图像中提取微不足道的特征,并添加分类头以预测类标签。该模型在CIFAR-10数据集上进行了训练,并评估了准确性和性能。这项研究的发现不仅会揭示视觉变压器模型在图像分类任务中的有效性,而且还可以作为解决复杂的视觉识别问题的强大工具的潜力。这项研究通过引入一种新颖的方法来填补现有的知识空白,该方法挑战了计算机视觉领域的传统卷积神经网络(CNN)。虽然CNN是图像分类任务的主要体系结构,但它们在捕获图像数据中的长距离依赖性方面存在局限性,并且需要手工设计的层次层次特征提取。关键字
主要关键词