点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
数据集不具代表性会导致模型在训练数据集上表现良好,但在实际使用中,当输入新数据或独特数据时,模型无法泛化。然而,原因却不同。如果模型训练时间过长或具有过多容量,用于记忆训练数据(而不是识别其中的潜在模式)或学习其中不相关的模式,则会发生过度拟合。例如,电子邮件垃圾邮件检测模型可能会在训练期间记住标记为垃圾邮件的电子邮件中的特定单词或短语。当这些确切的单词没有出现在现实世界的垃圾邮件中时,它就无法将其检测为垃圾邮件。
主要关键词