结果:我们表明,我们的Enzbert Transformer模型通过蛋白质语言模型的专业化而受过训练,可预测酶佣金(EC)数量,仅基于序列而优于单功能酶类预测的最先进的工具。在EC40基准上的第二级预测EC数量的预测中,精度从84%提高到95%。为了评估第四级的预测质量,这是最详细的EC数字,我们构建了两个新的基于时间的基准测试,以与最先进的方法ECPRED和DEEPEC进行比较:Macro-F1分别从41%提高到54%,从20%提高到20%。最后,我们还表明,使用一个简单的注意力图与EC预测任务上的其他经典性方法相当,或者比其他经典性方法更好。更具体地,注意图鉴定出的重要残基倾向于对应于已知的催化位点。量化,我们报告的最高F-GEAIN评分为96.05%,而经典的可解释性方法最多达到91.44%。