先前的一项研究使用 200,000 名经过外显子组测序的英国生物银行参与者对罕见编码变异进行了基于基因的加权负荷分析,确定了三个与 2 型糖尿病 (T2D) 在外显子组范围内显著相关的基因,即 GCK 、 HNF4A 和 GIGYF1 [ 1 ]。尽管 GCK 、 HNF4A 已被公认为是年轻人成年型糖尿病 (MODY) 的病因,但 GIGYF1 的含义是新的,尽管另一项研究很快证实了这一点,该研究使用了 379,000 名英国生物银行参与者的序列数据[ 2 - 4 ]。虽然这三个基因是唯一达到全外显子组显著性的基因,但共有 32 个基因具有显著性,未校正的 p 值 < 0.001,而鉴于有 20,384 个信息基因,只有 20 个是偶然出现的。此外,从生物学的角度来看,这些基因中有许多似乎具有潜在的意义。值得注意的是,许多其他在 2 型糖尿病中发挥了明确作用的基因未能通过加权负担分析产生强有力的关联证据,这些基因包括 HNF1A 、 HNF1B 、 ABCC8 、 INSR 、 MC4R 、 SLC30A8 和 PAM 。随后,使用多种不同表型对来自同一英国生物银行队列的大量外显子组测序参与者进行了罕见变异分析,所研究的一些表型包括 2 型糖尿病和相关疾病 [ 5 , 6 ]。全套 470,000 名参与者的外显子组序列数据现已更广泛地开放,本研究在新样本中对先前研究中 p < 0.001 时显著的基因以及上面提到的其他与 2 型糖尿病有关的基因进行了加权负担分析。本研究旨在检测关联证据,并将结果与上述多重表型研究的结果进行比较,以及描述不同类别的编码变异对相关基因风险的影响。本研究的目的是使用 270,000 个新获得的外显子组来测试一些在早期研究中经过多重检验校正后结果不显著的基因是否可以提供与新样本关联的证据。此外,拥有 470,000 个更大的样本意味着可以更准确地模拟相关基因中不同类别变异对疾病风险的影响。
主要关键词