2 泰国曼谷拉卡邦先皇理工学院信息技术学院,1 Chalong Krung 1 Alley,Ladkrabang,Bangkok 10520,泰国电子邮件:a treesukon.tr@kmitl.ac.th,b,* suvit@it.kmitl.ac.th(通讯作者)摘要。深度学习模型构建中监督学习的关键要求之一是用于训练和验证的数据集。为了收集数据集,从不同资源获取各种质量的图像是不可避免的,这被认为会影响监督模型的性能。本研究旨在证明涉及从两个不同资源获得的高和标准数据集的图像质量对模型性能的影响。对具有革兰氏阳性菌和革兰氏阴性菌数据集的各种细胞特征进行了试验。这些不同的数据集被匹配并贡献了 5 个案例;案例 1:使用高质量图像进行训练和测试,案例 2:使用高质量图像进行训练并使用标准质量图像进行测试,案例 3:使用标准质量图像进行训练和测试,案例 4:使用标准质量图像进行训练并使用高质量图像进行测试,以及案例 5:结合这两种图像质量进行训练和测试。实施了预训练的 CNN 模型来证明使用和不使用分层 K 折交叉验证的目的。重新训练模型的结果表明,高性能模型需要从与测试集相同资源中获得的高质量数据集,在具有挑战性的未知数据集上进行测试时,这些数据集可产生超过 90% 的所有性能评估指标。这项研究为构建可用于自动化微生物诊断的高性能模型提供了宝贵的见解,对公共卫生和临床实践产生了影响。