通过机器学习预测NBA冠军

建立一个机器学习模型来预测NBA冠军并分析最有影响力的变量。帖子预测NBA冠军的机器学习首先出现在数据科学方面。

来源:走向数据科学

每个NBA赛季,有30支球队竞争只能实现的目标:冠军的遗产。从权力排名到贸易截止日期和伤害,球迷和分析师都无休止地推测谁将提高拉里·奥布赖恩奖杯。

冠军的遗产

但是,如果我们可以超越热门的预测,并在常规赛结束时使用数据和机器学习预测NBA冠军怎么办?

使用数据和机器学习在常规赛结束时,预测NBA冠军 机器学习

在本文中,我将详细介绍这一过程 - 从收集和准备数据,到培训和评估模型,最后使用它来对即将到来的2024 - 25季后赛做出预测。一路上,我将重点介绍分析中最令人惊讶的见解。

所有使用的代码和数据都可以在GitHub上获得。

github

了解问题

在进行模型培训之前,任何机器学习项目中最重要的一步是理解问题:我们试图回答哪些问题,哪些数据(和模型)可以帮助我们到达那里?

我们要回答什么问题,哪些数据(和模型)可以帮助我们到达那里?

在这种情况下,问题很简单:谁将成为NBA冠军?

谁将成​​为NBA冠军? NBA

自然的第一个想法是将其视为分类问题:每个赛季中的每个球队都被标记为冠军或不冠军。

分类问题 冠军 不冠军

但是有一个捕获。每年只有一个冠军(显然)。

每年一个冠军

我们需要一种更聪明的方法来解决问题。

帮助该模型了解是什么使冠军成为了什么,也要教它几乎是冠军的原因,以及这与在第一轮被淘汰的球队有何不同。换句话说,我们希望该模型在季后赛中学习成功的程度,而不是简单的是/否结果。

几乎 成功度 冠军分享 16胜 20%