更好的机器学习模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

更好的机器学习模型

2025年8月22日 20:28 33 Comments

了解如何优化ML模型以更好地结果，帖子为更好的机器学习模型的三个基本的高参数调谐技术首先出现在数据科学方面。

来源:走向数据科学

学习（ML）模型不应记住培训数据。取而代之的是，它应该从给定的培训数据中学习得很好，以便可以很好地推广到新的，看不见的数据。

记忆学习概括

ML模型的默认设置对于我们试图解决的每种类型的问题可能无法正常工作。我们需要手动调整这些设置以获得更好的结果。在这里，“设置”是指超参数。

设置” 超参数

用户在训练过程之前手动定义了超参数值，并且在模型培训过程中不会从数据中学习其值。定义后，其值一直固定，直到用户更改为止。

我们需要区分超参数和参数。

参数从给定数据中学习其值，其值取决于超参数的值。在培训过程中更新了参数值。

这是一个示例，说明了不同的高参数值如何影响支持向量机（SVM）模型。

来自sklearn.svm导入svcclf_1 = svc（kernel ='linear'）clf_2 = svc（c，kernel ='poly'，deg = 3）clf_3 = svc（c，kernel ='poly ='poly = 1）

CLF_1和CLF_3模型都执行SVM线性分类，而CLF_2模型执行非线性分类。在这种情况下，用户可以通过更改SVC（）类中的“内核”超参数的值来执行线性和非线性分类任务。

CLF_1 CLF_3 CLF_2 “内核” svc（）

超参数调整是通过找到超参数的最佳值而不会导致过度拟合来优化模型性能的迭代过程。

有时，如上上面的SVM示例中，某些超参数的选择取决于我们要解决的问题类型（回归或分类）。在这种情况下，用户可以简单地将“线性”设置为线性分类，而对于非线性分类的“ poly”。这是一个简单的选择。

“线性” “ poly” “学位” n维 n

上面的培训参数的最佳值非线性网格搜索参数值不同的类型分类模型 CLF svc SVM 优化模型用户模型的 kernel 给定的 ML 其值学习参数 poly 分类的手动调整简单的过程数据线性分类