自监督学习 (SSL) 是一个丰富的框架,用于在大型数据集中获取有意义的数据表示。虽然 SSL 在计算机视觉和自然语言处理方面显示出令人瞩目的成果,但单细胞领域的多种应用仍需探索。我们研究 SSL 在空间分辨的单细胞 RNA 测序数据的细胞邻域中对细胞分类的应用。为了解决这个问题,我们开发了一个基于空间分子分析数据的 SSL 框架,整合了细胞在组织切片内的分子表达和空间位置。我们在大规模全鼠脑图谱上展示了我们的方法,记录了来自整个鼠脑的 59 个离散组织切片中 4,334,174 个单个细胞中 550 个基因的基因表达测量值。我们的实证研究表明,SSL 提高了下游性能,尤其是在存在类别不平衡的情况下。值得注意的是,我们观察到子图级别的性能改进比全图级别更显著。
主要关键词