太阳高能粒子 (SEP) 是空间天气中最危险的事件之一。在过去的几十年中,已经开发出多种技术来预测 SEP 的发生,主要基于 > 10 MeV 质子通量与某些前兆(例如太阳耀斑、日冕物质抛射等)之间的统计关联。在本文中,我们重点关注太阳质子事件实时警报 (ESPERTA) 的经验模型,该模型通过考虑三个输入参数来预测≥ M2 太阳耀斑发生后的 SEP 事件:耀斑源区经度、软 X 射线通量和 ∼ 1 MHz 的射电通量。在这里,我们在监督学习框架中重塑了 ESPERTA 模型,并对预测模型进行了交叉验证,同时应用了罕见事件校正(即数据过采样和损失函数加权),因为 SEP 发生的高度不平衡性。使用合成少数过采样技术可获得最佳性能,检测概率为 0.83,误报率 (FAR) 为 0.39。尽管如此,与不平衡情况相比,验证分数的改善很小。SEP 预测的相关 FAR 是样本基准率的自然结果。综上所述,我们给出的证据表明,预测 SEP 事件的统计方法应考虑以下因素:1) 需要根据 SEP 事件的预期发生情况校准模型,2) 决策阈值对模型性能有很强的影响,3) 模型中使用的特征,如果单独考虑,无法完全区分参数空间中的事件类别,因此使用处理不平衡问题的技术并不能保证更好的性能。
主要关键词