这项研究的主要目的是比较新学术数据库中的元数据量和研究出版物的完整程度。使用定量方法,我们选择了一个超过115,000个记录的随机交叉样本,然后在七个数据库(Dimensions,Google Scholar,Microsoft Academic,Openalex,Scilit,Scilit,Sminantic Scholar和The Lens)中搜索。分析了七个特征(摘要,访问,书目信息,文档类型,出版日期,语言和标识符),以观察描述此信息的字段,这些字段的完整性率以及数据库之间的协议。结果表明,学术搜索引擎(Google Scholar,Microsoft Academic和Sminantic Scholar)收集的信息较少,并且完整程度较低。相反,第三方数据库(Dimensions,Openalex,Scilit和The Lens)具有更高的元数据质量和更高的完整性率。我们得出的结论是,学术搜索引擎缺乏通过爬网来检索可靠的描述性数据的能力,第三方数据库的主要问题是源自整合不同来源的信息丢失。
所有文章由生物医学研究与环境科学杂志发表,并由Google Scholar,Crossref,Sminantic Scholar,grad Kudos,Scilit,Harvard Library Hollis,Harvard Hollis,研究门,基础搜索,互联网档案,华盛顿州立大学图书馆,Dimensions,Dimens,Dimens,Zenodo,OpenAire,Indexcopopernicus,ISI,ISI,ISI IMI,ISIDEDIMAT,ISIDED ISID ISID ISID ISID ISIVEST, Cabot大学图书馆,麦吉尔大学图书馆,NUS图书馆,VU图书馆,DET KGL Bibliotek,Publons,SJSU图书馆,UW图书馆搜索,Fit Library,Lub搜索图书馆,De Paris大学,DTU图书馆和学术Microsoft。