点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
在监督学习中,计算机学习预测人类给出的标签,例如根据带标签的狗图片预测特定的狗品种。无监督学习不需要标签,但有时采用自我监督学习,构建自己的预测任务,例如尝试预测句子中的每个连续单词。强化学习通过允许代理学习优化其总奖励的动作序列(例如赢得游戏)来实现自主性,而无需明确的良好技术示例。
主要关键词