脑图谱在神经科学中被广泛用作开展实验研究以及整合、分析和报告动物模型数据的资源。有各种各样的脑图谱可供选择,找到适合特定目的的最佳脑图谱并进行有效的基于脑图谱的数据分析可能具有挑战性。比较使用不同脑图谱报告的结果也并非易事,并且是可重复科学的障碍。通过这篇观点文章,我们提供了如何使用小鼠和大鼠脑图谱来分析和报告数据,符合 FAIR 原则,该原则提倡数据可查找、可访问、可互操作和可重复使用。我们首先介绍如何解释脑图谱并将其用于导航到大脑位置,然后讨论如何将它们用于不同的分析目的,包括空间配准和数据可视化。我们提供了有关神经科学家如何比较映射到不同脑图谱的数据并确保透明地报告结果的指导。最后,我们总结了选择图集时需要考虑的关键因素,并对基于图集的工具和工作流程对于 FAIR 数据共享的相关性进行了展望。
[查尔默斯 01] 大卫·查尔默斯,Hajime Hayashi 译:《意识:寻找大脑和精神的基本理论》,白洋社(2001) [克拉克 22] 安迪·克拉克,Takashi Ikegami 和 Gentaro Morimoto 译:《显现的存在:大脑、身体和世界的重新整合》,Hayakawa Publishing(2022) [笛卡尔 67] 勒内·笛卡尔,Taro Ochiai 译:《方法论》,Iwanami Bunko(1967) [德勒兹 12] 吉尔斯·德勒兹和菲利克斯·瓜塔里,Osamu Zaitsu 译:《什么是哲学?》,Kawade Bunko(2012) [丹尼特 96] 丹尼尔·丹尼特,Tadashi Wakashima 和 Manabu Kawata 译:《意图》 “态度”的哲学——人能读懂别人的行为吗? ,白洋社(1996) [Ganassia 19] Ganassia Jean-Gabriel,伊藤直子译:埋葬虚假的AI神话“奇点”,早川出版(2019) [Heidegger 13] Heidegger Martin,熊野澄彦译:存在与时间,岩波文库(2013) [Hume 04] 休谟·戴维,斋藤繁雄、一之濑正树译:人类智力研究——附人性论概要,法政大学出版会(2004) [Husserl 79] 胡塞尔·埃德蒙,渡边次郎译:理念 I-I 纯粹现象学概论,美铃书房(1979) [ Husserl 01] 埃德蒙德·胡塞尔,滨涡达二译:《笛卡尔的沉思》,岩波文库(2001) [Jung 16] 卡尔·荣格,林道吉译:《个体化与曼荼罗(新版)》,美铃书房(2016) [Kant 60] 伊曼纽尔·康德,篠田秀夫译:《纯粹理性批判》,岩波文库(1960) [Kurzweil 07] Ley Kurzweil,井上健、小野木章监修翻译
简介整合数据和知识是生物医学研究中的一项艰巨挑战。尽管新的科学发现正在迅速发现,但很大一部分知识要么被锁定在数据孤岛中(不同的命名法、数据模型和许可条款阻碍了整合;Wilkinson 等人,2016 年),要么被锁定在自由文本中。缺乏集成和结构化的生物医学知识版本会阻碍对这些信息的有效查询或挖掘,从而阻碍我们充分利用积累的科学知识。最近,科学界越来越强调确保所有科学数据的公平性——可查找、可访问、可互操作和可重用——并且越来越多地就一套具体的原则达成共识以确保公平性(Wilkinson 等人,2019 年;Wilkinson 等人,2016 年)。这些原则的广泛实施将极大地
图 1:STitch3D 概览。a. 来自多个 ST 组织切片的原始数据和来自参考 scRNA-seq 数据集的细胞类型特异性基因表达谱作为 STitch3D 的输入。b. STitch3D 的预处理步骤包括对来自不同组织切片的斑点进行对齐以构建斑点的 3D 位置,以及构建全局 3D 图。STitch3D 的主模型结合这些结构来执行表示学习,用于 3D 空间域识别和 3D 细胞类型反卷积。c. STitch3D 输出 3D 空间区域识别结果和组织中不同细胞类型的 3D 空间分布估计。STitch3D 还支持多种下游分析,包括空间轨迹推断、低质量基因表达测量值的去噪、虚拟组织切片的生成以及具有 3D 空间表达模式的基因识别。d. STitch3D 对多个切片进行联合建模,并利用基于图注意的神经网络学习具有 3D 空间信息的斑点和细胞类型比例的潜在表示。
作为一种模型生物,果蝇在帮助我们理解大脑如何控制复杂行为方面具有独特的贡献。它不仅具有复杂的适应性行为,而且还具有独特强大的遗传工具包、日益完整的中枢神经系统密集连接组图谱和快速增长的细胞类型转录组谱。但这也带来了一个挑战:鉴于可用数据量巨大,研究人员如何查找、访问、整合和再利用 (FAIR) 相关数据,以便开发电路的综合解剖和分子图像、为假设生成提供信息并找到用于测试这些假设的实验试剂?虚拟蝇脑 (virtual fly brain.org) 网络应用程序和 API 为这个问题提供了解决方案,它使用 FAIR 原理整合神经元和大脑区域的 3D 图像、连接组学、转录组学和试剂表达数据,涵盖幼虫和成虫的整个中枢神经系统。用户可以通过文本搜索、单击 3D 图像、按图像搜索和按类型(例如多巴胺能神经元)或属性(例如触角叶中的突触输入)查询,按名称、位置或连接性搜索神经元、神经解剖学和试剂。返回的结果包括可在链接的 2D 和 3D 浏览器中浏览或根据开放许可下载的交叉注册 3D 图像,以及从文献中整理的细胞类型和区域的详细描述。这些解决方案具有可扩展性,可以涵盖脊椎动物中类似的图谱和数据集成挑战。
摘要 在过去的几年中,计算机辅助药物再利用方法开始受到更多关注,因为它们提供了一种更快、更有效的治疗多种疾病的方法。虽然这些方法在预测能力方面很有前景,但由于其高度复杂的工作机制限制了它们的可解释性,因此在实践中使用这些方法仍然存在犹豫。可解释人工智能 (XAI) 以透明度、可解释性和信息性为主要基础,可以解决黑盒模型的局限性。在这种情况下,知识图谱 (KG) 可以利用生物医学领域提供给用户的解释,因为它们能够以语义一致的方式表示实体之间的关系。知识图谱有可能生成基于图形的表示,同时提供上下文,使其易于被人类解释。在本文中,我们提出了一种方法,即基于 KG 的可解释 AI 框架,用于药物再利用领域,作为 PREDICT 方法的扩展。该方法的核心是通过从输入中提取相关路径来生成基于相似性的解释,输入包括一种疾病和一种预测的治疗该疾病的药物。为了证明这种方法的实用性,我们通过对阿尔茨海默病进行用例来演示如何使用 KG 中使用的图形操作来生成合理的解释。我们的研究结果表明,利用生物医学 KG 和这种方法具有提供透明解释的巨大潜力,因为它能够说明与目标输入非常相关的药物、疾病实体之间的关系。将这种方法应用于药物再利用和其他类似领域,可能有助于克服计算药物再利用模型的黑箱性质所造成的局限性,并可能成为增强对模型决策过程的理解和简化领域专家和计算机科学家之间的科学交流的有力工具。
摘要:与神经发育障碍 (NDD) 和特征相关的 DNA 序列变异(单核苷酸多态性或变异,SNP/SNV;拷贝数变异,CNV)通常映射到假定的转录调控元件上,特别是增强子。然而,这些增强子控制的基因仍然定义不清。传统上,给定增强子的活性及其与序列变异相关的可能改变的影响被认为会影响最近的基因启动子。然而,在神经细胞染色质中获得全基因组长距离相互作用图挑战了这种观点,表明给定的增强子通常不与最近的启动子相连,而是与更远的启动子相连,跳过中间的基因。在本篇观点中,我们回顾了一些最近的论文,这些论文生成了长距离相互作用图谱(通过 HiC、RNApolII ChIA-PET、Capture-HiC 或 PLACseq),并将已识别的长距离相互作用 DNA 片段与与 NDD(如精神分裂症、躁郁症和自闭症)和特征(智力)相关的 DNA 序列变体重叠。这种策略允许将承载 NDD 相关序列变体的增强子的功能归因于位于线性染色体图谱远处的连接基因启动子。其中一些增强子连接基因确实已被鉴定为导致疾病,通过鉴定基因蛋白质编码区(外显子)内的突变,验证了该方法。然而,重要的是,连接基因还包括许多以前未在其外显子中发现突变的基因,指向 NDD 和特征的新候选贡献者。因此,长距离相互作用图谱与检测到的与 NDD 相关的 DNA 变异相结合,可用作识别新的候选疾病相关基因的“指针”。基于 CRISPR-Cas9 的方法对涉及增强子和启动子的长距离相互作用网络进行功能操控,开始探索已识别相互作用的功能意义以及所涉及的增强子和基因,从而提高我们对神经发育及其病理学的理解。
药物开发是一个资源和时间密集型的过程,导致流失率高达 90%。因此,重新利用具有既定安全性和药代动力学特征的现有药物正成为加速治疗方法开发的一种方式,这种做法越来越受到关注。我们开发了独特的机器学习驱动的自然语言处理和生物医学语义技术,挖掘了超过 5300 万份生物医学文档,自动生成 911M 边缘知识图谱。然后,我们应用了子图查询,使用遗传证据将药物与疾病关联起来,以确定多种疾病的潜在药物重新利用候选药物。我们使用一种尚无已知治疗方法的疾病——卡尼综合征来说明我们的方法。该分析显示,芦可替尼(Incyte,商品名 Jakafi)是一种具有既定安全性和有效性特征的 JAK1/2 抑制剂,已获准用于治疗骨髓纤维化,它通过脱靶药物活性,成为治疗卡尼综合征的潜在候选药物。
本文介绍了 MatKG,这是一个涵盖材料科学关键概念的新型图形数据库,涵盖了传统的材料结构-属性-处理范式。MatKG 通过基于转换器的大型语言模型自主生成,并通过统计共现映射生成伪本体模式。目前,MatKG 包含来自 80,000 个实体的超过 200 万个唯一关系三元组。这允许以独特的分辨率和比例对材料知识进行有针对性的分析、查询和可视化。此外,知识图谱嵌入模型用于学习图中节点的嵌入表示,这些表示可用于下游任务,例如链接预测和实体消歧。当用作知识库时,MatKG 允许快速传播和吸收数据,而当作为嵌入模型进行训练时,则可以发现新的关系。