该研究采用了跨六个阶段的实验设计。首先,文献综述确定了FMD爆发的关键风险因素,指导数据源选择。第二,历史数据是从各种来源追溯收集的。使用包括平均插补,重复的删除和可视化的技术,重点是数据预处理,以及检测分布变化的双向统计方法。在第四阶段,包括随机森林,支撑矢量机,分类和回归树,梯度提升机,逻辑回归,K-Nearest邻居和ADABOOST在内的七种ML算法,同时使用数据增强技术同时解决了类不平衡。第五和第六阶段涉及测试和验证这些模型以评估其在分布变化下的性能。探索了两种方法以增强模型性能:一种以数据为中心的方法,该方法集成了包括边界效果,主动学习,概率校准和伪标记的技术,以及一种以模型为中心的方法,涉及调整和堆叠随机森林,梯度增强机器和Adaboost。
主要关键词