Qingyu Chen 1, †, Alexis Allot 1, †, Robert Leaman 1, Rezarta Islamaj 1, Jingcheng Du 2, Li Fang 3, Kai Wang 3, 4, Shuo Xu 5, Yuefu Zhang 5, Parsa Bagherzadeh 6, Sabine Bagler 6, Sabine Bagler 6, Aak Bhatnagar 7, Nidhir Bhavsar 7, Yung-Cun Chang 8, Sheng-JIE LIN 8, Wentai Tang 9, Hongtong Zhang 9, Ilija Tavchioski 10, 11, Senja Pollak 11, Shubo Tian 12, Jhanfeng 12, Yulia Otmakhova 13, Antonio Jimeno Yeapes 14, Hang Dong 15, Honghan Wu 16, Richard Dufor 17, Yanis Labrak 18,Niladri Chatterjee 19,Kushagri Tandon 19,Fr ́EjusA。 A. Laleye 20,Locc Rakotoson 20,Emmanuele Chersoni 21,Jinghang Gu 21,Annemarie Friedrich 23,Subhash Chandra Pujari 22,23,23,23,23,23,23,23,23,23,Mariia Chizhikova 24Qingyu Chen 1, †, Alexis Allot 1, †, Robert Leaman 1, Rezarta Islamaj 1, Jingcheng Du 2, Li Fang 3, Kai Wang 3, 4, Shuo Xu 5, Yuefu Zhang 5, Parsa Bagherzadeh 6, Sabine Bagler 6, Sabine Bagler 6, Aak Bhatnagar 7, Nidhir Bhavsar 7, Yung-Cun Chang 8, Sheng-JIE LIN 8, Wentai Tang 9, Hongtong Zhang 9, Ilija Tavchioski 10, 11, Senja Pollak 11, Shubo Tian 12, Jhanfeng 12, Yulia Otmakhova 13, Antonio Jimeno Yeapes 14, Hang Dong 15, Honghan Wu 16, Richard Dufor 17, Yanis Labrak 18,Niladri Chatterjee 19,Kushagri Tandon 19,Fr ́EjusA。A. Laleye 20,Locc Rakotoson 20,Emmanuele Chersoni 21,Jinghang Gu 21,Annemarie Friedrich 23,Subhash Chandra Pujari 22,23,23,23,23,23,23,23,23,23,Mariia Chizhikova 24
摘要 — 在本研究中,我们介绍了我们参与 BioCreative VII 挑战赛的 DrugProt 任务的工作。药物-靶标相互作用 (DTI) 对于药物发现和重新利用至关重要,通常是从实验文章中手动提取的。PubMed 上有超过 3200 万篇生物医学文章,从如此庞大的知识库中手动提取 DTI 具有挑战性。为了解决这个问题,我们为 Track 1 提供了一个解决方案,旨在提取药物和蛋白质实体之间的 10 种相互作用。我们应用了一个集成分类器模型,该模型结合了最先进的语言模型 BioMed-RoBERTa 和卷积神经网络 (CNN) 来提取这些关系。尽管 BioCreative VII DrugProt 测试语料库中存在类别不平衡,但与挑战赛中其他提交的平均水平相比,我们的模型取得了良好的表现,微 F1 得分为 55.67%(BioCreative VI ChemProt 测试语料库为 63%)。结果显示了深度学习在提取各种类型 DTI 方面的潜力。