Loading...
机构名称:
¥ 2.0

计算双学学的最新研究趋势越来越集中于整合文本和生物实体建模,尤其是在分子和蛋白质的背景下。,以前的努力(例如Biot5)在跨越各种任务的概括方面面临着挑战,并且缺乏对分子结构的细微理解,尤其是在其文本代表中(例如,IUPAC)。本文介绍了Biot5+,这是Biot5框架的扩展,该框架是为了增强生物学研究和药物发现而定制的。biot5+结合了几种新颖特征:IUPAC名称的集成,用于分子理解,包括Biorxiv和PubChem等来源的扩展生物文本和分子数据,用于跨任务的多任务中的多任务指定调整,以及用于数值的数字处理的数值数据。这些增强功能允许Biot5+弥合分子表示之间的差距及其文本描述,从而提供了对生物实体的更全面的理解,并在很大程度上改善了对生物质量和生物序列的基础推理。该模型经过预先训练和微调,并通过大量实验,包括3种类型的问题(分类,回归,一代),15种任务和21种基准数据集,在大多数情况下表现出了显着的性能和现状的结果。biot5+因其在生物学数据中捕获复杂的关系船的能力而脱颖而出,从而有助于生物信息学和计算生物学。我们的代码可从https://github.com/qizhipei/biot5获得。

biot5+:通过IUPAC整合和多任务调整

biot5+:通过IUPAC整合和多任务调整PDF文件第1页

biot5+:通过IUPAC整合和多任务调整PDF文件第2页

biot5+:通过IUPAC整合和多任务调整PDF文件第3页

biot5+:通过IUPAC整合和多任务调整PDF文件第4页

biot5+:通过IUPAC整合和多任务调整PDF文件第5页