破译非编码基因组的调节功能是现代生物学的巨大挑战。模型物种长期以来一直处于生物发现和生物医学创新的最前沿,但是我们对顺式调节逻辑的了解仍然不完整(Manolio等人。2017)。许多重要的问题 - 主要:我们应该如何以组织特异性的方式变异蝇剂以改变其活性?哪些小鼠疾病基因的调节变体功能性?我们如何预测地编辑ge-Nome来有效指导实验?回答这些问题需要解释任何基因组变体的特定效应,包括对染色质状态,组蛋白修饰和转录因子(TFS)的结合的变化。在整个基因组变异范围内应对这一挑战需要从实验研究(例如CHIP-SEQ数据)中概括以了解调控代码,从而可以预测任何基因组变体的效果。这些影响必须在特定的文本中预测,包括发育阶段,细胞和组织类型以及药物治疗。模型生物的现有方法未达到这个目标。一种常见的方法是扫描具有位置重量矩阵的高度保守的结合位点。然而,这种主题的上下文信息有限,并且未能考虑经常描绘组蛋白标记或征用访问性的多个相互作用因素(Zhou and Troyanskaya 2015; Wagih等>2018)。2015; Avsec等。2021)。相反,基于序列的深度学习模型已成功地用于人类基因组学中,以从大规模测序数据中学习这种特定于文本的顺式调节代码,而无需使用手工设计的功能。特别是,这些模型中使用的许多连续的卷积层使它们可以学习相对复杂的主题,我们认为它们之间的相互作用(Lecun等人。这种灵活性,结合了允许这些模型的效率
收到日期:2020 年 9 月 8 日;修改稿收到日期:2020 年 11 月 24 日;接受日期:2020 年 11 月 26 日;J-STAGE 预发表于 2021 年 2 月 2 日在线发布 初审时间:38 天 千叶大学医学院呼吸内科,千叶(NT、SS、K. Tatsumi);西生会习志野医院肺动脉高压中心,习志野(NT);东京大学医学院医疗质量评估系,东京(H. Kumamaru);东京国际医疗福祉大学三田医院肺动脉高压中心(YT);濑户东正综合医院呼吸内科和过敏科(HT、TK、YK);神户药科大学临床药学系,神户(NE);日本铁路东京综合医院胸腔医学科,东京(YY、K. Tanaka);近畿大学医学院呼吸内科和过敏科,大阪(ON);北海道大学医院第一医学部,札幌(IT、HO、MN);长野红十字医院呼吸内科,长野(H. Kuraishi);神户大学医学院内科呼吸内科(Y. Nishimura);东京日本医学院医学院肺循环和呼吸衰竭高级医学科和呼吸内科,东京(H. Kimura);日本抗结核协会(JATA)福寿寺医院呼吸内科,东京(H. Kimura);(脚注续下页。)
16p11.2 和 22q11.2 拷贝数变异 (CNV) 会增加患自闭症谱系障碍 (ASD)、精神分裂症 (SZ) 和注意力缺陷多动障碍 (ADHD) 的风险,但它们对功能连接 (FC) 的影响仍不清楚。我们在此报告了使用来自 101 名 CNV 携带者、755 名特发性 ASD、SZ 或 ADHD 患者和 1,072 名对照者的磁共振成像数据对静息态 FC 进行的分析。我们描述了 CNV FC 特征并使用它们来识别导致复杂特发性疾病的维度。CNV 在全球和区域层面对 FC 具有很大的镜像效应。丘脑、躯体运动和后岛叶区域在缺失、重复、特发性 ASD、SZ 但不 ADHD 共有的连接障碍中起着关键作用。与缺失 FC 特征相似度较高的个体表现出更差的认知和行为症状。在连接水平上识别出的缺失相似性可能与基因表达空间模式和 FC 特征之间在全基因组范围内观察到的冗余关联有关。结果可能解释了为什么许多 CNV 会影响类似范围的神经精神症状。
图 1:信息子图提取的动机:(a)演示了从群体水平连接组数据中获取边推理矩阵的过程;(b)说明常用的社区检测结果(例如使用随机块模型)无法检测到任何信息子图;(c)显示现有密集子图发现结果的结果;(d)描述了一种理想的信息子图检测程序,该程序可以识别由信息边组成的有组织的、生物学上可解释的拓扑结构。(d)中的结果基于 ADSD 方法(详细信息请参阅结果部分)。
序号 化合物/药物 分子式 化合物 ID 1 阿朱尼汀 C 36 H 58 O 10 3052779 2 阿朱酸 C 30 H 48 O 5 15385516 3 阿朱醇酸 C 30 H 48 O 5 73641 4 阿朱酮 C 19 H 20 O 6 14034821 5 阿朱皂苷 C 30 H 48 O 6 12444386 6 β-谷甾醇 C 29 H 50 O, 222284 7 木麻黄苷 C 41 H 28 O 26, 13834145 8 鞣花酸 C 14 H 6 O 8 5281855 9 没食子酸乙酯 C 9 H 10 O 5 13250 10 没食子酸酸 C 7 H 6 O 5 370 11 木犀草素 C 15 H 10 O 6 5280445 12 槲皮素 C 15 H 10 O 7, 5280343 13 苦素酸 C 30 H 48 O 4 355369274 14 儿茶素 C 15 H 14 O 6, 73160 15 芦丁 C 27 H 30 O 16, 5280805 16 山奈酚 C 15 H 10 O 6, 5280863 17 白花青素 C 15 H 14 O 7, 71629 18 3-O-甲基鞣花酸 3'-鼠李糖苷