摘要简介:原发性线粒体疾病(PMD)包括由核DNA(NDNA)或线粒体DNA(mTDNA)中的致病变异引起的大型且异构的遗传疾病。广泛采用下一代测序(NGS)已提高了mtDNA诊断的效率和准确性;但是,仍然存在一些挑战。涵盖的区域:在本综述中,我们简要总结了MTDNA分子诊断的现行状态,并考虑改善了整个基因组测序(WGS),生物信息学技术的含义以及对PMD诊断的长期读取测序的采用。专家意见:我们预计,从血液DNA中使用无PCR WG的诊断实验室将增加,而对于具有肌病性表现的成年人,来自肌肉DNA的WGS可能会变得更加广泛。改进的生物信息学策略将增强WGS数据询问,并在WGS数据中更准确地描绘mtDNA和NUMTS(核线粒体DNA片段),较高的覆盖范围均匀性,间接的间接测量值MTDNA拷贝数的测量值以及更准确的精确解释,并更准确地解释了杂型级别的大小列表。单独的采用诊断长阅读序列可以为复杂的LSR提供更大的分辨率和相位异质变体的机会。
概述. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 从 BAM 中提取 UMI. . . . . . . . . . . . . . . . . . . . . . . 8 执行适配器修剪和质量过滤. . . . . . . . . . . . . . 9 从 FASTQ 文件中选择读取的子样本. . . . . . . . . . . 10 将读取映射到参考基因组. . . . . . . . . . . . . . . . . 10 将 UMI 信息添加到 BAM 中的读取. . . . . . . . . . . . . 11 识别和分组来自同一源分子的读取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 将共识读取映射到参考基因组. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 注释变体. . . . . . . . . . . . . . . . . . . . . . . . . . . 21 VCF 到表格. . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 纵向突变分析. . . . . . . . . . . . . . . . . . . . . 22 生成背景面板和阻止列表 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 计数光学重复. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...
摘要。- 目的:这项研究的目的是鉴定枢纽基因并揭示糖尿病性视网膜病(DR)的骨质机制。材料和方法:我们在我们的研究中使用了基因表达综合(GEO)DATASET GSE60436。在筛选差异表达的基因(DEG)后,我们形成了基因和基因组(KEGG)功能分析的基因本体学(GO)和京都百科。随后,使用搜索工具来检索相互作用的基因(String)数据库并使用Cytoscape软件进行访问,并使用搜索工具进行了搜索工具来构建蛋白 - 蛋白质相互作用(PPI)网络。最后,我们通过CytoHubba插件确定了10个集线器基因。结果:总共确定了592摄氏度,包括203个上调的基因和389个下调基因。DEG主要富含视觉感知,光感受器外部段膜,视网膜结合和PI3K-AKT信号通路。通过构建蛋白质 - 蛋白质间的作用(PPI)网络,最终确定了10个中心基因,包括CNGA1,PDE6G,RHO,ABCA4,PDE6A,PDE6B,PDE6B,NRL,RPE65,RPE65,GUCA1B和AIPL1。结论:CNGA1,PDE6G,RHO,ABCA4,PDE6A,PDE6B,NRL,RPE65,GUCA1B和AIPL1可能是潜在的生物标志物,而治疗性TAR-可用于DR。
背景和目的:肝细胞癌(HCC)是世界上十大最常见的恶性肿瘤之一,它是世界上一个主要问题。中医(TCM)在预防和治疗HCC方面具有许多优势,但其复杂的作用机理很难澄清,这限制了其研发。生物信息技术的持续发展为TCM研究提供了新的方法和机会。这项研究使用现代网络药理学和生物信息学方法来探索中草药化合物Fuzheng fuzheng fuzheng小颗粒(FZXLG)的可能分子机制,以治疗HCC,为其临床应用和基本研究提供理论基础,以促进TCM的现代化,以促进其世界化的应用。方法:通过TCMSP,BATMAN-TCM和其他数据库收集FZXLG的活性成分。通过PubChem和Swisstarget Prediction预测FZXLG的目标;通过Genecards,OMIM和其他疾病数据库获得了与HCC疾病相关的靶标,并筛选了FZXLG的潜在基因靶标。构建了用于治疗HCC的FZXLG的“处方-tcms-ingredients-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets-targets”。分析了TCGA数据库中HCC肿瘤和非肿瘤邻近组织的差异表达基因(DEG),以获得HCC的预后基因。然后,筛选了影响HCC预后的FZXLG基因,并进一步筛选核心靶基因。研究了HCC患者的核心基因表达与预后,免疫细胞浸润和免疫组织化学变化之间的相关性。基因和基因组的百科全书(KEGG)富集分析和基因本体学富集分析,对影响HCC预后的FZXLG基因进行了使用David Database进行了。AutoDockTools软件随后用于分子对接验证。结果:用于HCC治疗的FZXLG的十种核心有效成分包括多种类黄酮成分,例如槲皮素,Luteolin和formononetin。11影响HCC预后的FZXLG的核心靶标被筛选,其中雌激素受体1(ESR1)和催化酶(CAT)是有利的预后因素,而EGF,MMP9,CCNA2,CCNB1,CCNB1,CDK1,CDK1,CHEK1,CHEK1,CHEK1和E2F1是不良的预测因素。MMP9和EGF与六个TIIC子集正相关。CAT,PLG,AR,MMP9,CCNA2,CCNB1,CDK1和E2F1的不同表达水平与正常肝癌和肝癌的免疫组织化学染色变化相关。KEGG途径富集分析产生了33个途径,包括细胞周期,p53,乙型肝炎和其他信号通路。分子对接证实了主要核心成分与保护性预后核心靶标ESR1和CAT具有良好的结合。结论:FZXLG可以通过多种成分,多个靶标和多种途径来治疗HCC,从而影响HCC的预后,免疫微环境和免疫组织化学变化。
摘要。– 目的:2 型糖尿病 (T2DM) 和多囊卵巢综合征 (PCOS) 是常见的内分泌系统疾病。然而,在转录组水平上对 T2DM 和 PCOS 的分子机制研究仍然很少。因此,我们旨在通过生物信息学分析揭示 T2DM 和 PCOS 之间潜在的共同遗传和分子途径。材料与方法:我们从美国国家生物技术信息中心的基因表达综合 (GEO) 数据库下载了 T2DM 和 PCOS 的 GSE10946 和 GSE18732 数据集。对这些数据集进行综合差异和加权基因共表达网络分析 (WGCNA) 以筛选共同基因。随后进行功能富集和疾病基因关联分析,构建转录因子 (TF)-基因和TF-miRNA-基因调控网络,最终确定相关的靶向药物。结果:我们鉴定了T2DM和PCOS的共同基因(BIRC3,DEPTOR,TNNL3,ADRA2A)。通路富集分析显示共同基因在平滑肌收缩,通道抑制剂活性,细胞凋亡和肿瘤坏死因子 (TNF) 信号通路中富集。SP7,KLF8,HCFC1,IRF1和MLLT1等TF在TF调控网络中起关键作用。奥利司他被指出是一种重要的基因靶向药物。
糖尿病患者容易患糖尿病性肾脏疾病(DKD),可能导致心血管损伤,高血压和肥胖症,并降低生活质量。结果,患者的生活质量大大降低。然而,糖尿病肾病(DKD)的发病机理尚未完全阐明,目前的治疗仍然不足。因此,探索DKD的分子机制及其并发症至关重要。下一代序列(GSE217709)数据集从基因表达综合(GEO)数据库中获得。通过R软件挑选出差异表达的基因(DEG)。然后,通过人类整合蛋白质蛋白质相互作用参考(Hippie)数据库构建了GEGS的profiler数据库(pPI)的基因本体论(GO)和Reactome途径富集分析。模块分析是通过Cytoscape插件Pewcc进行的。随后,miRNET数据库和NetworkAnalyst数据库进行了miRNA-HUB基因调节网络和TF-HUB基因调节网络。最后,通过接收器操作特征(ROC)曲线分析对中心基因进行验证,以预测集线器基因的诊断有效性。总共确定了958摄氏度,包括479个加速和479个受调节基因。GO和DEG的途径富集变化主要富含生物调节,多细胞生物过程,GPCR和细胞外基质组织的信号传导。生物信息学分析是探索DKD及其并发症的分子机制和发病机理的有用工具。与DKD相关的十个集线器基因(HSPA8,HSPA8,HSPA5,HSPA5,SDCBP,HSP90B1,VCAM1,MYH9,MYH9,FLNA,MDFI和PML)及其并发症及其并发症。确定的枢纽基因可能参与DKD的发作和发展及其并发症,并作为治疗靶标。
子宫内膜在人类物种的繁殖和延续中起重要作用。雌激素和孕激素水平调节子宫内膜,在整个月经周期中经历了动态功能变化(1,2)。但是,异常子宫内膜功能导致流产或不育症。例如,一个薄的子宫内膜是无法解释的不育症(UI),复发妊娠丧失(RPL)和胎盘异常的关键原因(3)。RPL定义为在怀孕20-24周之前,包括胚胎和胎儿丧失在内的两个或多个临床确认的怀孕失败,适合怀孕的女性的发病率约为2.5%(4,5)。UI is another pregnancy disorder and is defined as women with normal follicle-stimulating hormone (FSH), luteinizing hormone (LH), estradiol (E2), prolactin (PRL), and thyroid stimulating hormone (TSH) levels, normal uterine cavity shape and size, and bilateral tubal patency on a hysterosalpingogram, and their partners have normal spermiogram结果(6)。UI最多代表所有不孕症病例的30%(7)。当当前的诊断方法确实提供了解释,并且没有明确的原因, RPL和UI会被诊断出来。 这些疾病对妇女的身心健康以及社会经济有重大影响。RPL和UI会被诊断出来。这些疾病对妇女的身心健康以及社会经济有重大影响。
胶质瘤是成人最常见的原发性颅内肿瘤,占所有中枢神经系统肿瘤的46%~70%(1-3)。流行病学调查显示,胶质瘤发病率逐年升高,男性发病率高于女性。胶质瘤的预后随年龄和病理类型而异,5年生存率较低,尤其是多形性胶质母细胞瘤(GBM)和老年患者。世界卫生组织(WHO)将中枢神经系统胶质瘤分为低级别和高级别(4)。根据该分类,低级别胶质瘤分为I级和II级(5)。I级肿瘤为良性、生长缓慢的胶质瘤,II级肿瘤有发展为高级别胶质瘤的潜力。高级别胶质瘤可分为III级和IV级。III级肿瘤肿瘤细胞增多,转移和复发率高(6-8)。 Ⅳ级胶质瘤恶性程度最高,具有高度增殖、转移、血管生成和坏死的特征。WHO肿瘤分级是治疗结果的预后因素之一,其他因素包括患者年龄、肿瘤部位、手术切除范围、增殖指数等。Ⅱ级和Ⅲ级肿瘤患者的生存期分别为5年和2~3年(9)。Ⅳ级肿瘤患者在1年内死于该病,取决于目前有效的治疗方案(9)。
将结核病 (TB) 基因组变异转化为临床应用的一个主要挑战是整合与疾病相关的变异,并通过基因组驱动的药物再利用概念促进药物发现。在这里,我们利用两个已建立的基因组数据库,即全基因组关联研究 (GWAS) 和全表型关联研究 (PheWAS) 来识别与结核病相关的基因组变异,并进一步将其用于药物靶向基因。我们评估了 3.425 个与结核病相关的基因组变异,这些变异与 200 个结核病相关基因重叠。为了确定生物结核病风险基因的优先级,我们设计了一个计算机模拟流程,并利用基于六个功能注释(错义突变、顺式 -eQTL、生物过程、细胞成分、分子功能和 KEGG 分子通路分析)的成熟生物信息学方法。有趣的是,基于我们应用的六个功能注释,我们发现 14 个生物结核病风险基因与生物结核病风险基因的失调密切相关。因此,我们证明了 12 个药物靶基因与 40 种用于其他适应症的药物重叠,并进一步表明这些药物可能被重新用于治疗结核病。我们强调 CD44、CCR5、CXCR4 和 C3 是极有前途的拟议结核病靶点,因为它们与 SELP 和 HLA-B 相关,而 SELP 和 HLA-B 是功能注释上系统评分较高的生物结核病风险基因。总之,当前的研究揭示了与结核病发病机制有关的基因组变异作为生物结核病风险基因,并提供了结核病基因组学可能有助于药物发现的经验证据。
苔藓植物是研究植物进化、发育、植物-真菌共生、应激反应和配子发生的有用模型。此外,它们占主导地位的单倍体配子体阶段使它们成为功能基因组学研究的绝佳模型,允许通过 CRISPR 或同源重组进行直接的基因组编辑和基因敲除。然而,直到 2016 年,唯一公布的苔藓植物基因组序列是 Physcomitrium patens 的序列。近年来,其他几种苔藓植物基因组和转录组数据集已经面世,从而使得在进化研究中进行更好的比较基因组学成为可能。可用的苔藓植物基因组和转录组资源数量不断增加,产生了大量的注释、数据库和生物信息学工具来访问新数据,这些数据涵盖了该进化枝的多样性,其生物学特征包括与丛枝菌根真菌的关联、性染色体、低基因冗余或细胞器转录本的 RNA 编辑基因丢失等。在这里,我们提供了有关苔藓植物基因组和转录组数据库以及生物信息学工具的可用资源指南。