详细内容或原文请订阅后点击阅览
数据科学项目的十大免费API提供商
探索这些免费的API,以访问实时,高质量的数据集,从地理空间信息到社交媒体对话。
来源:KDnuggets#简介
#为您的数据科学项目获取现实世界中的数据通常是最难的部分。玩具数据集很容易找到,但是对于高质量或实时数据,通常需要使用API或构建自定义刮擦管道来从网络中提取信息。
在本文中,我分享了我最喜欢的10个免费API,即每天用于数据集成,数据集成和构建AI代理的API。这些API分为五个类别,涵盖了受信任的数据存储库,Web刮擦和Web搜索,因此您可以快速选择正确的工具并更快地从数据移动到洞察力。
#基础数据存储库
基础数据存储库是一个基于社区的平台,不同的组织和开源贡献者与更广阔的世界共享其数据集。使用一个简单的命令,您可以访问项目的这些数据集。
//1。KaggleAPI
//Kaggle数据集在从事数据科学项目时非常受欢迎。您可以创建一个数据管道,而不是手动下载它们,该数据管线将自动下载数据集,解压缩并加载到工作区中。
Kaggle这些数据集由开源社区共享,每个人都可以使用。首先,请从您的Kaggle帐户生成一个API密钥,并将其设置为环境变量。之后,您可以在终端中运行以下命令。 Kaggle还提供了Python SDK,可以轻松地与您的代码集成。
Kaggle数据集下载-D Kingabzpro/World -Vaccine -Progress -P数据-UNZIP
// 2。拥抱脸cli
与Kaggle类似,拥抱面孔也是一个数据科学和机器学习社区,人们共享数据集,模型和演示。您可以轻松地安装拥抱面CLI并使用CLI命令或Python代码将其集成到工作流中。这两个选项都允许您下载数据集而无需API密钥。
拥抱脸仅在数据集门控时才需要一个API密钥。