详细内容或原文请订阅后点击阅览
10 Python单线以优化您的机器学习管道
本教程将专注于十个实用的单线,这些单线利用Scikit-Learn和Pandas等图书馆的力量来帮助简化您的机器学习工作流程。
来源:KDnuggets#简介
#在机器学习方面,效率是关键。编写干净,可读和简洁的代码不仅可以加快开发的速度,还可以使您的机器学习管道更易于理解,共享,维护和调试。 Python具有自然和表现力的语法,非常适合制作强大的单线,这些单线只能在一行代码中处理常见的任务。
本教程将专注于十个实用的单线,这些单线利用Scikit-Learn和Pandas等图书馆的力量来帮助简化您的机器学习工作流程。我们将介绍从数据准备和模型培训到评估和功能分析的所有内容。
Scikit-Learn pandas让我们开始。
#设置环境
在制定代码之前,让我们导入我们在整个示例中使用的必要库。
将大熊猫作为pd导入 来自sklearn.model_selection导入train_test_split,cross_val_score,gridSearchcv 从Sklearn.Preprocessing Import StandardardScaler,OneHotenCoder 来自sklearn.linear_model导入logisticRegress 从sklearn.semblection incort intim 来自Sklearn.svm导入SVC 来自Sklearn.Pipeline Import Pipeline 来自sklearn.datasets import load_iris 从sklearn.metrics导入精度
随之而来的是,让我们编码...一次。
#1。加载数据集
让我们从其中一个基础开始。从项目开始通常意味着加载数据。 Scikit-Learn配备了几个玩具数据集,非常适合测试模型和工作流程。您可以将功能和目标变量加载到单个干净的线路中。
x,y = load_iris(return_x_y = true)
此单线使用load_iris函数,并设置return_x_y = true直接返回功能矩阵X和目标向量y,从而避免了解析类似字典的对象的需要。
load_iris
return_x_y = true
x
y
#2。将数据分解为培训和测试集
train_test_split
test_size = 0.3
strawify = y
fit
LogisticRegress
cv = 5
f1
c