摘要在这项工作中,我们使用尖端的机器学习方法来解决模因中的性别歧视问题。该研究首先要导入和可视化模因数据集,然后使用包括种植,缩放和标准化的技术进行图像进行预处理,以便为它们做好准备进行模型培训。一种称为剪辑的预训练模型用于提取功能,并且数据集分为西班牙语和英语的模因的培训和验证集。收集的功能用于训练和评估各种机器学习模型,例如逻辑回归,SVM,XGBoost,决策树,随机森林,神经网络,Adaboost和SGD。精确得分,分类报告和混乱矩阵用于评估性能。随机森林模型在所有这些模型中都表现出了最好的作用。之后,创建了包含模型预测性别歧视发生在测试数据集中的JSON文件。结果强调了训练有素的模型和复杂的机器学习方法如何在社交媒体上识别危险内容,为未来的研究提供有见地的信息以及有助于创建更安全的在线空间的有用应用。
主要关键词