先进的深度学习方法,例如基于变压器的基础模型,有望学习生物学的表示,可以在硅中预测未见实验的结果,例如遗传扰动对人类细胞跨文字的影响。要查看当前模型是否已经达到了这个目标,我们对两个重要的用例中有意地模拟有意模拟的线性模型进行了基准测试:在两个重要用例中有意模拟的线性模型:对于两个基因的组合扰动,只能看到单个单个扰动的数据,我们发现一种简单的添加剂模型超过了基于深度学习的方法。,对于尚未看到的基因的扰动,但可以从生物学相似性或网络环境中“插值”,一个简单的线性模型与基于深度学习的方法一样好。虽然深层神经网络对生物系统的代表和实验结果的词语的承诺是Plausible的,但我们的工作强调了对旨在将转移学习转移到生物学的直接研究工作的批判性基准的需求。
先进的深度学习方法,例如基于变压器的基础模型,有望学习生物学的表示,可以在硅中预测未见实验的结果,例如遗传扰动对人类细胞跨文字的影响。要查看当前模型是否已经达到了这个目标,我们对两个重要的用例中有意地模拟有意模拟的线性模型进行了基准测试:在两个重要用例中有意模拟的线性模型:对于两个基因的组合扰动,只能看到单个单个扰动的数据,我们发现一种简单的添加剂模型超过了基于深度学习的方法。,对于尚未看到的基因的扰动,但可以从生物学相似性或网络环境中“插值”,一个简单的线性模型与基于深度学习的方法一样好。我们的资产表明,术语模型学到的生物学尚不允许推断训练数据的特定实验条件超出特定的实验条件,而对相反的最新主张可能还为时过早。