当研究人员收集单细胞数据并将其细化为细胞图谱时,一项关键任务是对每种细胞类型进行表征和标记或注释。“这通常是一项非常耗时、繁重的任务,只有少数生物学专家才能完成,”计算生物学家、麻省理工学院和哈佛大学布罗德研究所 HCA 细胞注释平台负责人 Evan Biederstedt 说。研究人员已经开发了几种自动标记细胞的程序,但这些工具并不总是能得出相同的答案。popV 就是个例子。它的功能简单但功能强大:它将八种自动细胞注释工具整合到一个平台中,并且可以在有更多工具可用时添加 1 。“这是一个加速工具,”联合开发者、加州大学伯克利分校的计算生物学家 Can Ergen 说。拥有新鲜生成的单细胞 RNA 测序数据的研究人员可以将其加载到 popV 中,八种方法中的每一种都会对细胞身份进行“投票”——因此该工具的全名是 popular Vote。对于任何给定的细胞,用户可以检查所有八种注释是否一致,或者对可能的身份是否存在分歧投票。如果这些方法对某种细胞类型的判定一致,研究人员就可以对其身份充满信心;如果存在分歧,可能就没那么自信了。为了量化这一点,popV 提供了“不确定性分数”,以便用户知道在其鉴定中可以给予多大信任度。“这真的很酷,”Regev 说。PopV 使用来自 Tabula Sapiens 的数据进行训练,Tabula Sapiens 是一张人类细胞图谱,涵盖了近 500,000 个细胞,代表了 15 个人的 24 个器官。研究人员随后在来自人类肺细胞图谱 2 的数据库上对其进行了测试;根据最终论文,popV 的预测与大多数注释一致,比任何单个计算注释器都更准确。Biederstedt 计划将 popV 整合到 HCA 细胞注释平台用户界面中,科学家将能够在对细胞类型进行分类时查看 popV 的预测。“它确实让社区更接近自动细胞注释的梦想,并将极大地帮助研究人员,”他说。一旦研究人员发现了一种有趣的细胞类型或状态,他们可能会想知道它还会出现在哪里。Regev 和她的同事开发了 SCimilarity 来回答这个问题。该软件可以获取感兴趣的细胞概况
主要关键词