通过数据镜头看夏季奥运会

使用 Python 和 Wikipedia 绘制获奖国家的地理和网络地图。继续阅读 Towards Data Science »

来源:走向数据科学

透过数据看夏季奥运会

使用 Python 和 Wikipedia 绘制获奖国家地理和网络地图。

今年的夏季奥运会将在巴黎举行,几天后我们就要开始行动了,因此我决定以数据科学家的身份深入研究奥运会的历史,否则我就不会对奥运会的细节有太深入的了解。

也就是说,依靠公开的 Wikipedia 数据,我想找出哪些国家曾经是奥运会上最耀眼的明星,以及谁是彼此最大的竞争对手。具体来说,我收集了每个国家获得的金牌、银牌和铜牌总数,并细分到各个运动项目。然后,我将奖牌总数放在全球地图上,使用奖牌运动概况来构建和可视化类似的国家网络,以说明具有相似运动概况的国家之间的竞争集群。

让我们开始构建数据集吧!

所有图片均由作者创建。

所有图片均由作者创建。

1. 数据库

1. 1. 获取完整的奥运国家列表

首先,我找到了维基百科网站,标题为历届奥运会奖牌榜,其中有简短的摘要……

历届奥运会奖牌榜 历届奥运会奖牌榜