Loading...
机构名称:
¥ 1.0

本文继承了十年前编辑维基百科的十条简单规则[1]。它介绍了维基百科的机器可读表亲:维基数据——从计算生物学的角度来看,这个项目可能更具相关性。维基数据是一个免费的协作知识库[2],为每个维基百科页面及其他页面提供结构化数据。它依赖于与维基百科相同的同行生产原则:任何人都可以做出贡献。开放的协作模式在实践中往往出人意料地高效,尽管在理论上它们似乎不太可能奏效。尽管如此,它们在学术圈仍然遭到很多抵制和怀疑[3,4]。自 2012 年上线以来,维基数据已迅速发展成为一个跨学科的开放知识库,内容涵盖从基因到细胞类型再到研究人员[2,5-7]。它具有广泛的应用,例如验证有关疾病爆发的统计信息[8]、协调人类冠状病毒资源[9]或评估生物多样性[10,11]。它可以被认为是一个巨大的网络图(图1A),其中的项目作为节点(现在超过1亿个),通过超过十亿条语句相互链接,并通过数十亿条语句进一步链接到更广泛的网络。我们将在文中用斜体字链接到示例维基数据项目和属性(图1)。在线界面使项目本身具有一定的人性化可读性(图1B),但它们的结构化特性使其能够以完全用散文编写的信息源无法实现的方式查询和组合信息。这种多功能性使其在计算生物学中的应用比仅仅依赖维基百科更加通用和灵活[12]。维基数据上的查询范围很广,从哪些基因变异可以预测结直肠癌的阳性预后,到按荷兰以其名字命名的街道数量对分类单元进行分类。我们将尝试使用与计算生物学相关的例子,但请记住,几乎所有东西都可以这样做,从苏格兰中世纪女巫处决地图到按使用人口划分的紧急电话号码,再到描绘青蛙的画作。由于它属于 CC0 版权豁免,因此 Wikidata 的结构化内容基本上已发布到公共领域以用于其他项目 [ 13 ]。您可能已经在搜索引擎结果的顶部看到了它的结构化数据,但它也在幕后使用

编辑维基数据的十个快速技巧

编辑维基数据的十个快速技巧PDF文件第1页

编辑维基数据的十个快速技巧PDF文件第2页

编辑维基数据的十个快速技巧PDF文件第3页

编辑维基数据的十个快速技巧PDF文件第4页

编辑维基数据的十个快速技巧PDF文件第5页

相关文件推荐

2018 年
¥2.0
2021 年
¥1.0
2023 年
¥1.0
2023 年
¥1.0
2025 年
¥1.0
2021 年
¥1.0
2007 年
¥1.0
2022 年
¥1.0
2024 年
¥1.0
1900 年
¥1.0
2024 年
¥1.0
2023 年
¥1.0
2022 年
¥1.0
2023 年
¥1.0