本文提出了一种通过从文本科学语料库中提取相关实体并以结构化和有意义的方式组织它们来构建两个特定领域知识图的方法。该方法使用语义Web技术,涉及重复使用共享的基于RDF的标准词汇。theaiageresearchgroup 1收集了8,496Scientificarticlespublybethighthewewewnebetnexweew中与小麦的选择有关。我们使用alvisnlp [1]工作流程来识别指定的实体(NE)以及小麦品种和表型之间的关系。总共有88,880个提及4,318个不同命名的实体已被识别为frompubMedAbstractsantles。同样,收集的ThediaDeresearchGroup 217,058Sci-InfificarticlespublyBetebethextewnekewnevewnemtheybetebetikeentbewnextectikeentebetike from thearoryzabasedatabase [2],该[2]在手术中检查了与水稻基因组学相关的PubMed条目。我们使用hunflair ner tagger [3]在标题和文章摘要中提取NES。总共确定了351,003个提及63,591个不同的NE。双皮属性介于thatrefertogenes,遗传标记,特征,表型,分类群和品种实体中提到的标题和摘要出版物中提到的实体。在可能的情况下,这些NE与现有语义资源相关。小麦表型和特质提及与小麦特质本体论3(WTO)中的类别有关,分类单元与NCBI 4分类学类别有关。inderfaphsthecorepartofthedatamodelisbasadeonthew3cwebannotationology(OA),已与不同的词汇相辅相成,描述了Yacoubi等人中描述的文档。[4]。施工管道涉及两个主要步骤。首先,我们使用SPARQL微服务[5]来查询PubMed的Web API,并将文章的元数据(包括标题和摘要)转换为RDF 5。其次,使用Alvisnlp [1]和Hunflair [3]来提取和链接