详细内容或原文请订阅后点击阅览
通过数据镜头看夏季奥运会
使用 Python 和 Wikipedia 绘制获奖国家的地理和网络地图。继续阅读 Towards Data Science »
来源:走向数据科学透过数据看夏季奥运会
使用 Python 和 Wikipedia 绘制获奖国家地理和网络地图。
今年的夏季奥运会将在巴黎举行,几天后我们就要开始行动了,因此我决定以数据科学家的身份深入研究奥运会的历史,否则我就不会对奥运会的细节有太深入的了解。
也就是说,依靠公开的 Wikipedia 数据,我想找出哪些国家曾经是奥运会上最耀眼的明星,以及谁是彼此最大的竞争对手。具体来说,我收集了每个国家获得的金牌、银牌和铜牌总数,并细分到各个运动项目。然后,我将奖牌总数放在全球地图上,使用奖牌运动概况来构建和可视化类似的国家网络,以说明具有相似运动概况的国家之间的竞争集群。
让我们开始构建数据集吧!
所有图片均由作者创建。
所有图片均由作者创建。1. 数据库
1. 1. 获取完整的奥运国家列表
首先,我找到了维基百科网站,标题为历届奥运会奖牌榜,其中有简短的摘要……
历届奥运会奖牌榜 历届奥运会奖牌榜