摘要:科学知识传统上是通过在期刊、会议论文集和在线档案中发表的研究文章来传播和保存的。然而,这种以文章为中心的范式经常受到批评,因为它不能自动处理、分类和推理这些知识。另一种愿景是生成语义丰富、相互关联的研究出版物内容描述。在本文中,我们提出了人工智能知识图谱 (AI-KG),这是一个自动生成的大规模知识图谱,描述了 820K 个研究实体。AI-KG 包含从 333K 个人工智能领域的研究出版物中提取的大约 14M 个 RDF 三元组和 1.2M 个具体化语句,并描述了由 27 种关系链接的 5 种类型的实体(任务、方法、指标、材料、其他)。 AI-KG 旨在支持各种智能服务,用于分析和理解研究动态、支持研究人员的日常工作以及帮助资助机构和研究政策制定者做出决策。AI-KG 是通过应用自动管道生成的,该管道使用三种工具提取实体和关系:DyGIE++、Stanford CoreNLP 和 CSO Classifier。然后,它使用深度学习和语义技术的组合来集成和过滤生成的三元组,以生成高质量的知识图谱。该管道根据手工制作的黄金标准进行了评估,获得了具有竞争力的结果。AI-KG 在 CC BY 4.0 下可用,可以作为转储下载或通过 SPARQL 端点查询。
本文提出了一种通过从文本科学语料库中提取相关实体并以结构化和有意义的方式组织它们来构建两个特定领域知识图的方法。该方法使用语义Web技术,涉及重复使用共享的基于RDF的标准词汇。theaiageresearchgroup 1收集了8,496Scientificarticlespublybethighthewewewnebetnexweew中与小麦的选择有关。我们使用alvisnlp [1]工作流程来识别指定的实体(NE)以及小麦品种和表型之间的关系。总共有88,880个提及4,318个不同命名的实体已被识别为frompubMedAbstractsantles。同样,收集的ThediaDeresearchGroup 217,058Sci-InfificarticlespublyBetebethextewnekewnevewnemtheybetebetikeentbewnextectikeentebetike from thearoryzabasedatabase [2],该[2]在手术中检查了与水稻基因组学相关的PubMed条目。我们使用hunflair ner tagger [3]在标题和文章摘要中提取NES。总共确定了351,003个提及63,591个不同的NE。双皮属性介于thatrefertogenes,遗传标记,特征,表型,分类群和品种实体中提到的标题和摘要出版物中提到的实体。在可能的情况下,这些NE与现有语义资源相关。小麦表型和特质提及与小麦特质本体论3(WTO)中的类别有关,分类单元与NCBI 4分类学类别有关。inderfaphsthecorepartofthedatamodelisbasadeonthew3cwebannotationology(OA),已与不同的词汇相辅相成,描述了Yacoubi等人中描述的文档。[4]。施工管道涉及两个主要步骤。首先,我们使用SPARQL微服务[5]来查询PubMed的Web API,并将文章的元数据(包括标题和摘要)转换为RDF 5。其次,使用Alvisnlp [1]和Hunflair [3]来提取和链接
我是Linking Uni-Cersity计算机和信息科学系的高级副教授。此外,我是与亚马逊Web Services的Neptune Graph Database团队一起工作的亚马逊学者。我拥有博士学位。柏林Zu Universit的计算机科学专业,并获得了Linkoping University的计算机科学学术资格奖。我对与数据和数据库管理有关的问题感兴趣。我在这个广泛的上下文中的重点是在网络上和图形数据上以及数据分布在多个,自主和/或异质源上的问题上。关于这些主题,我的兴趣范围从系统构建相关研究(例如,数据的有效存储,查询处理和查询优化)一直到理论基础(例如,查询语言的复杂性和表达能力)。我因我的博士学位而在2015年获得SWSA杰出论文奖。论文“查询链接数据的网络:基础和查询执行”,以及2019年SWSA十年奖励,我的论文“通过链接数据的网络执行SPARQL查询”的论文开创了基于毛线的疑问执行的概念,以及在整个网络上查询链接数据的概念。此外,我已经获得了八项最佳纸张奖(ESWC 2009,ESWC 2015,ISWC 2017,2018和2019,IIWAS 2020,Sentics 2021,Coopis 2023),我被选为著名的Wallenberg Academy Fel-fel-fel-fel-fel-fel-Lows计划。此外,我曾在多个计划委员会任职,并参加了两个W3C工作组的标准化工作专家。我定期组织国际科学研讨会和会议;最值得注意的是,我是ISWC 2019的研究轨道联合主席,以及ESWC 2024的In-In-track联合主席。根据Google Scholar的说法,我的出版物已收到4900多个引用,而我的H索引是29。