拷贝数变体(CNV)在遗传性疾病和癌症的分子发病机理以及正常的人间变异中起着重要作用。但是,它们仍然很难在主流测序项目中识别,尤其是涉及外显子组测序,因为它们通常发生在非针对分析的DNA区域中。为了克服这个问题,我们开发了非高峰,这是一种用户友好的CNV检测工具,该工具以denoising方法为基础,并且使用“''target''DNA读取,通常通过测序管道来丢弃它。我们根据96种癌症的靶向测序以及来自三种不同人群的遗传性视网膜疾病的个体的130个个体进行了基准测试。对于两组数据,非高峰均表现出出色的性能(> 95%的灵敏度和> 80%的特定峰与实验验证),可在仅检测单独的硅数据中的CNV,这表明其对分子诊断和遗传研究的直接适用性。
南亚印度人中临床可操作的肥厚性心肌病基因 Vinay J Rao a,b ,理学硕士,Thiagarajan Sairam a ,哲学博士,Andiappan Rathinavel c ,MCh,,Kurukkanparampil Sreedharan Mohanan d ,医学博士,Hisham Ahamed e ,医学博士,Jayaprakash Shenthar f ,医学博士,Perundurai S Dhandapany a,* ,哲学博士。a 心血管发育和疾病机制,干细胞科学和再生医学研究所(DBT-inStem),班加罗尔,印度。b 跨学科健康科学与技术大学,Yelahanka,班加罗尔,印度。c 心血管胸外科系,马杜赖医学院和政府 Rajaji 医院,马杜赖,印度。d 心脏病学系,政府医学院,科泽科德,印度。 e 肥厚性心肌病中心,Amrita 医学科学院,Amrita Viswa Vidyapeetham(Amrita 大学),印度科钦。f 心脏病学系,Sri Jayadeva 心血管科学与研究研究所,印度班加罗尔。* 联系人:Perundurai S Dhandapany;dhan@instem.res.in 摘要背景:原发性肥厚性心肌病 (HCM) 主要是遗传性疾病,在没有其他心脏和全身代谢疾病的情况下导致左心室肥大。目前,关于南亚印度人 (SAI) 中原发性 HCM 临床可操作基因变异的流行率的数据有限,这对于尽量减少对祖先特异性变异的解释差异是必要的。目的:ClinGen 遗传性心血管疾病 (HCVD) 基因管理专家小组根据临床相关性将 HCM 致病基因分为五类:明确、强、中等、有限和有争议。然而,缺乏对 SAI 中这种分类的全面研究。方法:对 335 名原发性 SAI-HCM 患者进行全外显子组测序,包括所有已知的心血管基因和临床可操作的基因类别,以确定它们的等位基因频率。结果:SAI-HCM 外显子组在 335 例中的 119 例 (35.52%) 中揭示了 26 个临床可操作基因中总共 194 个 P/LP 和 VUS。与其他全球 HCM 队列相比,SAI-HCM 队列在 12 个明确类别基因中表现出的变异明显较少(17.33% vs. 41.21%,P = 0.0003)。对于 5 个强/中等基因,SAI-HCM 队列与其他全球 HCM 队列之间无显著差异(2.59% vs. 2.49%,P = 1)。在 21 个有限且有争议的基因中,MYH6 在 SAI-HCM 队列中的变异流行率明显高于其他全球 HCM 队列(5.07% vs. 1.67%,P = 0.0408)。
先前的一项研究使用 200,000 名经过外显子组测序的英国生物银行参与者对罕见编码变异进行了基于基因的加权负荷分析,确定了三个与 2 型糖尿病 (T2D) 在外显子组范围内显著相关的基因,即 GCK 、 HNF4A 和 GIGYF1 [ 1 ]。尽管 GCK 、 HNF4A 已被公认为是年轻人成年型糖尿病 (MODY) 的病因,但 GIGYF1 的含义是新的,尽管另一项研究很快证实了这一点,该研究使用了 379,000 名英国生物银行参与者的序列数据[ 2 - 4 ]。虽然这三个基因是唯一达到全外显子组显著性的基因,但共有 32 个基因具有显著性,未校正的 p 值 < 0.001,而鉴于有 20,384 个信息基因,只有 20 个是偶然出现的。此外,从生物学的角度来看,这些基因中有许多似乎具有潜在的意义。值得注意的是,许多其他在 2 型糖尿病中发挥了明确作用的基因未能通过加权负担分析产生强有力的关联证据,这些基因包括 HNF1A 、 HNF1B 、 ABCC8 、 INSR 、 MC4R 、 SLC30A8 和 PAM 。随后,使用多种不同表型对来自同一英国生物银行队列的大量外显子组测序参与者进行了罕见变异分析,所研究的一些表型包括 2 型糖尿病和相关疾病 [ 5 , 6 ]。全套 470,000 名参与者的外显子组序列数据现已更广泛地开放,本研究在新样本中对先前研究中 p < 0.001 时显著的基因以及上面提到的其他与 2 型糖尿病有关的基因进行了加权负担分析。本研究旨在检测关联证据,并将结果与上述多重表型研究的结果进行比较,以及描述不同类别的编码变异对相关基因风险的影响。本研究的目的是使用 270,000 个新获得的外显子组来测试一些在早期研究中经过多重检验校正后结果不显著的基因是否可以提供与新样本关联的证据。此外,拥有 470,000 个更大的样本意味着可以更准确地模拟相关基因中不同类别变异对疾病风险的影响。