This paper presents a comprehensive performance evaluation of various AI architectures for a classification of holes drilled in melamine faced chipboard, including custom Convolutional Neu- ral Network (CNN-designed), five-fold CNN-designed, VGG19, single and five-fold VGG16, an en- semble of CNN-designed, VGG19, and 5xVGG16, and Vision Transformers (VIT)。每个模型的性能都根据其分类精度进行了测量和比较,视觉变压器模型,尤其是对8000个时期训练的B_32模型,以71.14%的精度证明了出色的性能。尽管取得了成就,但该研究强调了平衡模型性能与其他考虑因素(例如计算资源,模型复杂性和培训时间)的必要性。结果强调了仔细的模型选择和微调的重要性,不仅是由性能指标引导的,而且还取决于任务和上下文的特定要求和约束。这项研究为进一步探索其他基于变压器的模型提供了坚实的基础,并鼓励对模型进行微调的更深入研究,以利用这些AI体系结构对图像分类任务的全部潜力。
主要关键词