为生物搜索中使用的显微镜图像仍然是一个重要的挑战,尤其是对于跨越数百万图像的大规模实验。这项工作探讨了经过越来越较大的模型骨架和显微镜数据集训练时,弱监督的clasifirers和自我监管的蒙版自动编码器(MAE)的缩放属性。我们的结果表明,基于VIT的MAE在一系列任务上的表现优于弱监督的分类器,在召回从公共数据库中策划的已知生物学关系时,相对实现的相对效果高达11.5%。此外,我们开发了一种新的通道敏捷的MAE架构(CA-MAE),该体系结构允许在推理时输入不同数字和通道的图像。我们证明,在不同的实验条件下,在不同的实验条件下,CA-MAE通过推断和评估在显微镜图像数据集(Jump-CP)上有效地概括了,与我们的训练数据(RPI-93M)相比,通道结构不同。我们的发现促使人们继续研究对显微镜数据进行自我监督学习,以创建强大的细胞生物学基础模型,这些模型有可能促进药物发现及其他方面的进步。与此工作发布的相关代码和选择模型可以在以下网址找到:https://github.com/ recursionpharma/maes_microscopy。
主要关键词