STRING数据库(版本11.0)是描述和展示各种蛋白质之间相互作用的主要来源,涵盖约2460万种蛋白质和来自5.09万个生物体的超过31亿种相互作用。首先,我们将重叠基因上传到STRING网站,并以最小相互作用评分>0.4(低置信度)作为显著阈值。然后下载蛋白质-蛋白质相互作用(PPI)的TSV格式文件,用Cytoscape软件构建PPI网络。随后,利用Cytoscape自带的分子复合物检测(MCODE)和STRING应用程序对显著的基因模块(簇)进行分类,这些基因模块在PPI网络中具有高度互联的簇。MCODE中的参数采用默认设置。对基因模块中的基因进行药物-基因相互作用分析。
图 1. 实现治疗遗传目标的荟萃分析流程图。从不同的数据库中提取基因表达数据集。使用 R 编程语言对数据进行分析和可视化。通过分析测试数据集获得 DEG,然后通过验证数据集进行验证。使用 STRING 数据库从 DEG 构建 PPI 网络,使用 R 软件分析网络,使用 Cytoscape 对网络进行可视化,并从 ClueGO Cytoscape 插件和 Enrichr 在线工具获得富集结果。接下来,使用生存分析和表达谱对表达结果进行进一步验证。最后,将我们的结果与其他研究进行比较,并询问已验证 DEG 的分子机制以提出靶向疗法的组合。
图 1. 实现治疗遗传目标的荟萃分析流程图。从不同的数据库中提取基因表达数据集。使用 R 编程语言对数据进行分析和可视化。通过分析测试数据集获得 DEG,然后通过验证数据集进行验证。使用 STRING 数据库从 DEG 构建 PPI 网络,使用 R 软件分析网络,使用 Cytoscape 对网络进行可视化,并从 ClueGO Cytoscape 插件和 Enrichr 在线工具获得富集结果。接下来,使用生存分析和表达谱对表达结果进行进一步验证。最后,将我们的结果与其他研究进行比较,并询问已验证 DEG 的分子机制以提出靶向疗法的组合。
材料与方法 AS 数据集 本研究中,我们从基因表达综合 (GEO) 数据库 (http://www.ncbi.nlm.nih.gov/geo/) 中获得了 AS 的转录组表达谱 GSE43292 (GPL6244)、GSE57691 (GPL10558) 和 GSE125771 (GPL17586)(表 S1)。使用 R 包“limma”对 GSE43292、GSE57691 和 GSE125771 进行探针汇总、合并和背景校正。 微环境评分 ESTIMATE 算法主要基于单个样本的基因集富集分析 (GSEA),利用表达谱数据对基质细胞和免疫细胞进行评分,然后预测这两类细胞的含量。本研究采用ESTIMATE算法对动脉微环境进行评分,并使用R包绘制微环境评分的散点图,以展示样本与评分之间的关系。TPM2与微环境评分的关系以基质、免疫和ESTIMATE评分作为对差异基因筛选确定的基因进行分组的依据。使用R包“limma”研究TPM2与微环境评分之间的关系。使用受试者工作特征(ROC)曲线检验微环境评分与TPM2关系的诊断价值。加权基因共表达网络分析(WGCNA)使用R包“WGCNA”对所有基因进行WGCNA。对于WGCNA,使用72个AS样本和42个正常样本构建所有基因的共表达网络。使用样本创建邻接矩阵,然后将其转换为拓扑重叠矩阵(TOM)。利用基于TOM的差异测量方法将基因划分为不同的基因模块,最小基因模块>100,相似模块合并的阈值为0.1,利用这些值寻找在AS中发挥重要作用的模块。同时,还利用WGCNA预测模块中基因之间的互连,然后将数据导入Cytoscape软件以绘制基因之间的连接图。还利用基因本体论(GO)分析对TPM2进行了分析,并使用Cytoscape中的BiNGO插件将结果可视化。Cytoscape软件可以为生物学家提供生物网络分析和二维(2D)可视化。BiNGO插件是一种用于确定哪些GO类别在一组基因或生物网络的子图中具有统计过度表达的工具。BiNGO将给定基因集的主要功能主题映射到GO层次结构上,并将此映射输出为Cytoscape图。功能富集分析GSEA是一种可以对全基因组进行GO和KEGG(京都基因和基因组百科全书)分析的计算方法。在我们的研究中,我们根据TPM2的表达水平对样本进行分组,并使用GSEA对全基因组进行GO和KEGG分析。单基因分析 使用 R 包“limma”进行单基因差异分析。 鉴定与 AS 相关的 TPM2 比较毒理基因组学数据库 (CTD 数据库,http://ctdbase.org/) 可用于预测基因/蛋白质与疾病之间的关系。在我们的研究中,使用该数据库分析了 TPM2 与 AS 之间的关系。
乳腺癌(BC)是发病率和病情高的女性中最常见的癌症。因此,生物标志物检测仍然需要新的研究。GSE1124和GSE182471数据集,以评估差异表达的圆形RNA(CIRCRNA)。使用乳腺癌国际联盟(代表)数据库的癌症基因组图集(TCGA)和分子分类学用于鉴定明显的失调的microRNA(miRNA)和基因,并考虑了对微阵列分类的预测分析(PAM50)的预测分析。使用癌症特异性的circrna,mirdb,mirtarbase和mirwalk数据库研究了cirna-miRNA-mRNA关系。使用基因和基因组(KEGG)途径数据库的基因本体论(GO)分析和京都百科全书使用基因分析(GO)分析和京都百科全书来注释CircrNA – MiRNA -MRNA调节网络。蛋白质 - 蛋白质相互作用网络是由字符串数据库构建的,并通过Cytoscape工具可视化。然后,根据PAM50亚组中的特定表达水平,使用某些选择标准对RAW miRNA数据和基因进行过滤。使用Cytohubba Cytoscape插件来获得一种瓶颈方法来获得高度相互作用的集线器基因。在我们的研究中,在miRNA和circrna轴内检测到的这些枢纽基因进行了无病生存和整体生存分析。我们确定了可能在卑诗省起重要作用的三个circrnas,三个miRNA和十八个候选靶基因。另外,已经确定这些分子在BC的分类中可以有用,尤其是在确定基础样乳腺癌(BLBC)亚型时。我们得出的结论是,在BC的BLBC亚组中,HSA_-CRIC_0000515/mir-486-5p/sdc1轴可能是诱因患者的重要生物标志物候选者。
背景:黑色素瘤是起源于黑色素细胞的皮肤恶性肿瘤,主要通过手术、化疗、靶向治疗、免疫治疗、放射治疗等治疗。靶向治疗是治疗晚期黑色素瘤的一种有前途的方法,但总是会发生耐药性。本研究旨在利用计算方法有效地识别耐药黑色素瘤的潜在靶基因和候选药物。方法:使用文本挖掘工具 pubmed2ensembl 识别与耐药黑色素瘤相关的基因。通过 GO 和 KEGG 通路富集分析进行进一步的基因筛选。使用 STRING 数据库和 Cytoscape 构建 PPI 网络。使用 GEPIA 进行生存分析并绘制 Kaplan-Meier 曲线。在 Pharmaprojects 中筛选出针对这些基因的药物。利用 DeepPurpose 预测了药物-靶标相互作用的结合亲和力得分。结果:通过文本挖掘共发现 433 个与耐药黑色素瘤相关的基因。 GO和KEGG分析中统计学差异最大的功能富集通路包含348个基因,通过Cytoscape中的MCODE进一步筛选出27个枢纽基因。经过生存分析和文献综述,鉴定出6个具有统计学差异的基因。在限制条件下,利用Pharmaprojects找到了16个针对枢纽基因的候选药物。最终,利用DeepPurpose预测出11个亲和力得分最高的ERBB2靶向药物,包括10个ERBB2激酶抑制剂和1个抗体-药物偶联物。结论:文本挖掘和生物信息学是药物发现中基因识别的有效方法。DeepPurpose是一种高效、可操作的深度学习工具,可用于预测DTI和选择候选药物。
通过 DAVID(https://david.ncifcrf.gov/)[23] 进行分析。确定了每个基因组的前 10 个 GO 术语和前 8 个 KEGG 通路术语,即最富集的术语,如图 4 所示。使用 R 中的 ggplot 包比较了 D1 的 KDTN、D3 的 KDSN 以及 DTSG 的 KDTN 和 KDSN 之间的分布。然后,我们使用 Cytoscape 为 DTSG 集中涉及的药物和基因构建了一个药物-靶标二分网络。为了进行网络可视化,使用了 19 种药物和 170 种基因;这 19 种药物约占 DTSG 集中包含的 371 种药物的 5%。此外,使用 m 核分解的概念进行网络分析,根据 KDTN 和 KDSN 分析中心功能。“剥离算法”旨在表征网络枢纽并阐明
摘要:陈皮、半夏对NSCLC有良好的治疗作用已被认可,但基于网络药理学分析陈皮、半夏治疗NSCLC的潜在机制尚不明确。利用Cytoscape构建“药物-成分-靶点-疾病”网络,利用STRING构建蛋白质相互作用(PPI)网络。本研究从TCMSP数据库中筛选出陈皮、半夏的18个有效成分,鉴定出陈皮、半夏治疗NSCLC的56个靶基因,构建了“药物-成分-靶点-疾病”网络。本研究筛选出56个PPI核心基因,建立PPI网络。我们推测,红花油和半夏治疗NSCLC的网络药理学机制可能与TP53、ESR1、FOS、NCOA3和MAPK8等蛋白表达密切相关,并通过调控IL-17信号通路、抗原加工与呈递、癌症中的microRNA以及内分泌抵抗等发挥治疗作用。
技能在基因组和功能基因组领域的经验大约25年,在各种类型的肿瘤病理学中占据了“多霍米克”分析的发展和执行。在织物和液体活检(血浆,CSF,尿液等)的NGS分析方面具有深入的知识,其平台的平台为:i)第二代人(NextSeq,Novaseq XPlus)对整个ESOM,RNASEQ,miRNaseq,miRNaseq,甲基化,甲基化,CNV,Metagenomica和Metagenomica和Metatrastrascittomica; ii)第三代作为甲基化/CNV的纳米孔。在“多霍姆”数据的管理和处理方面具有悠久的经验,包括使用工具的能力:i)在R环境中分析统计计算和图形的R环境中的数据; ii)识别由大学课程认证的途径(GSEA,Ingenuitity途径分析,Cytoscape)(“生物信息学”和“生物信息学方法”; Valentini教授。米兰的生物分子和生物信息学生物技术学位)。