Loading...
机构名称:
¥ 1.0

由于其有效的性能,卷积神经网络(CNN)和视觉变压器(VIT)架构已成为解决计算机视觉任务的标准。此类架构需要大量的数据集,并依靠卷积和自我注意操作。在2021年,MLP-Mixer出现了,与CNN和VIT相比,仅依赖于多层感知器(MLP)并取得极具竞争力的结果。尽管在计算机视觉任务中表现良好,但MLP混合体架构可能不适合图像中的精制功能提取。最近,提出了Kolmogorov-Arnold网络(KAN)作为MLP模型的有希望的替代品。kans有望提高与MLP相比的准确性和可解释性。因此,目前的工作旨在设计一种新的基于混音器的架构,称为Kan-Mixers,使用KAN作为主要层,并根据几个性能指标在图像分类任务中评估其性能。作为主要结果,Kan-Mixers模型在时尚摄影和CIFAR-10数据集中优于MLP,MLP-Mixer和KAN模型,分别为0.9030和0.9030和0.6980,分别为平均精度。

kan-mixers:

kan-mixers:PDF文件第1页

kan-mixers:PDF文件第2页

kan-mixers:PDF文件第3页

kan-mixers:PDF文件第4页

kan-mixers:PDF文件第5页