在药物发现中,识别靶蛋白和分子之间的结合至关重要。当每个任务的信息量较小时,多任务学习方法已被引入以促进任务之间的知识共享。然而,多任务学习有时会降低整体性能或在各个任务的性能之间产生权衡。在本研究中,我们提出了一种通用的多任务学习方案,通过组选择和知识提炼,不仅可以提高平均性能,还可以最大限度地减少个体性能的下降。根据配体靶标组之间的化学相似性来选择组,并将同一组中的相似靶标一起训练。在训练过程中,我们应用教师退火的知识提炼。多任务学习模型由单任务学习模型的预测引导。这种方法的平均性能高于单任务学习和经典多任务学习。进一步的分析表明,多任务学习对于低性能任务特别有效,知识提炼有助于模型避免多任务学习中单个任务性能的下降。
主要关键词