序列的模式(4)。但是,共识序列并不代表序列中的所有信息,因为在许多情况下,其他碱基也出现了很大的频率。例如,主要是Aug的procaryotic启动密码子也有时也有Gug和Uug。如果人们忽略了这些可能性,则已经扭曲了数据。这是共识序列是结合位点的差模型的几个原因之一(5,6)。在绑定站点中特定位置的重要性更清楚地始终如一地描述了那里的模式所需的信息(7,8)。从同样可能的可能性中选择一个符号或状态需要一个“位”信息。例如,要向某人传达硬币弹的结果需要1个信息,因为只有一个是不是一个问题:“是头吗?”。如果绑定站点中的位置始终包含一个基数(例如g),然后我们需要两个信息,因为需要回答两个是的问题:“是A还是G?”(即是嘌呤吗?)和'是A还是C?”。(如果两个问题的答案都是“否”的,则必须是T。)此外,如果职位包含两个基础(例如有时A,有时是G),只有一个问题就足够了,因为四分之二的选择等同于两个选择中的一个。因此,仅需要一个位来描述仅包含嘌呤的结合位点的位置,但是需要两个位来描述始终包含腺嘌呤的位置。在1948年,克劳德·香农(Claude Shannon)展示了如何做到这一点(7,8)。如果碱的频率不是完全概括的,则需要更复杂的计算以在某个位置找到平均信息。在香农之后,我们将不确定性度量定义为: