该代码是在Python和Jupyter Notebook [7]中创建的,可以用作未来ML应用程序的模板。在《代码海洋胶囊》中,我们包括了jupyter笔记本和python脚本,以便其他人可以复制与原始研究中相同的结果。该软件有两个部分。第一部分实现了五个ML模型(Logistic回归(LR),K -Neart最邻居(KNN),幼稚的贝叶斯(NB),随机森林(RF)和极端梯度提升(XGBOOST))。在第二部分中实施了两个深度学习模型(多层感知器(MLP)和卷积神经网络(CNN))。将这些模型的性能与准确性,精度,召回和F1得分进行了比较。之后,探索了最佳模型的特征重要性,特征相关性,可变聚类,混淆矩阵和内核密度估计(KDE)。
主要关键词