识别潜在有趣的基因或类似基因的特征的一种方法是使用cDNA数据库。CDNA对于基因鉴定很有用,因为它们是由mRNA制成的,并反映了基因组的表达区域。为了在时间和财务上进行大规模的cDNA测序,随机采用cDNA克隆,并测序cDNA的一端或两端。每个cDNA克隆仅在一个通过中进行测序,就像单个基因组读数一样。这些序列通常称为表达的序列标签(ESTS)。因此,EST是低质量的核酸序列,所有与单读相同的问题。大多数EST仅代表cDNA的一部分(一端或另一端)。但是,它们可以用作构建更完全注释的mRNA的构建块,例如RefSeq mRNA数据库中发现的一些序列。除了相对较低的EST读取质量(大约2%的误差)外,EST还具有其他局限性。通常,归一化程序用于允许对稀有的转录本进行采样。但是,仍然存在偶然的可能性,可能完全因为它们的表现较低或不在给定的库中而完全丢失了稀有的成绩单。转录本也可能遗漏,因为它们未在用于构建各种cDNA文库的组织,细胞类型或发育阶段表达。(有关更多信息,请参见NCBI手册。)在本练习中,我们将使用mRNA和EST序列指导和验证我们的注释工作。
主要关键词