1分子生物技术中心,都灵大学,都灵大学的动机基因和活生物体的蛋白质通过与其他基因和蛋白质的一系列相互作用来部署其功能。这些关系可以或多或少是直接的,并且可以从不同类型的实验证据中推断出来。最明显的关系是直接的分子相互作用,可以通过生化方法和分子生物学技术(例如酵母两种杂种系统)显示出来。然而,在没有直接分子结合的情况下,甚至可能存在非常紧密的功能关系。考虑到相同功能涉及的基因倾向于显示非常相似的表达模式,并且鉴于大量基因表达数据存储库的可用性,共表达分析是探索基因之间功能关系复杂性的最强大工具之一。特别是,已经提出了对共表达的系统发育保护,作为识别基因之间功能相关的联系的非常强大的标准。我们先前已经描述了CLOE(Pellegrino等,MBC Bioinformatics 2004),这是一种基于此类荟萃分析的数据挖掘方法,使得可以对蛋白质功能和相互作用做出高度的置信度预测。作为逻辑演化,我们基于对cDNA微阵列数据库的分析,在全球尺度上应用了此方法,在这里,我们提出了人与小鼠之间保守的共表达关系的网络。方法DNA微阵列数据是从使用cDNA微阵列技术进行的已发表的研究获得的。 电子邮件:ugo.ala@unito.it方法DNA微阵列数据是从使用cDNA微阵列技术进行的已发表的研究获得的。电子邮件:ugo.ala@unito.it在工作中,我们从斯坦福微阵列数据库(http://smd.stanford.edu/cgi/cgi-bin/search/search/search/search/search/search/pl.pl)收集了人类和鼠标数据,这是微阵列实验的最相关存储库。通过Genebank ID鉴定了所有探针,我们将它们完全重新映射到了最重要的生物学数据库,尤其是Unigene,Entrez基因和Ensembl。在同源表的基础上分配了直系同源基因之间的关系。计算分析始于生成,对于数据集中的每个探针,所有其他数据集探针,由以Pearsons相关系数计算的共表达指数顺序排序。选择了每个列表的最高1%,我们崩溃了探针列表,称为同一基因(由Entrez基因ID确定)。我们引入了系统发育保护以比较直系同源基因的列表。我们使用元基因(元基因代表直系同源基因对)构建网络,为节点,一对一的系统发育保守的共表达链接作为边缘。我们进行了统计分析,以评估所有基因的基因本体论(GO)术语的富集,并为了探索人类表型的可能的预测价值,我们将注意力集中在Mimminer(http://wwwwwwwwwwwwwwwwwwwwwwwwwwwww.cmbi.ruuuuu.ruu.ruu.ruu.ruu.ruu.ruu.ruu.ruu.nl/mmmmmmimmin/c,pla-cl ),最后,我们评估了该网络与文献和两个基于混合的人类相互作用的重叠。结果我们的初步结果表明,每个基因的第一个邻居构成的近30%的列表至少富集了一个GO术语,并且在相关疾病表型的两个基因之间的链接数量有七个时间丰富。这些结果强烈表明,人与小鼠之间的共表达关系与探索哺乳动物基因的功能和研究人遗传疾病非常相关。
主要关键词