估计没有诊断的疾病率

免疫基因作为疾病后疾病疾病率的预测因素,没有诊断疾病率首先出现在数据科学方面。

来源:走向数据科学

基因对于触发免疫系统非常重要,以至于我们可以使用这些基因来预测一个人的免疫反应。在这里,我将演示如何仅从免疫基因频率中估计疾病率。从获取免疫基因数据到确定高风险国家以及评估模型的局限性的所有步骤都将在github.com/dawells/hla_spondylitis_rate上获得。

github.com/dawells/hla_spondylitis_rate

HLA基因与一个人对感染,疫苗接种的反应有关,并且通常与自身免疫性疾病密切相关。实际上是如此紧密的联系,以至于我们可以从HLA基因频率中预测疾病率。 HLA频率得到了广泛的研究并经常可用,使我们能够估计由于诊断的挑战而可能缺少或不准确的自身免疫性状况。在这篇文章中,我们将结合研究以产生对免疫基因频率的准确估计,并使用这些估计来预测全国强直性脊柱炎的速率。

等位基因。NET是来自世界各地人类免疫基因频率数据的数据库,该数据库是开放访问,免费和公共资源(Gonzalez-Galarza等,2020年)。但是,很难下载和结合多个项目的数据。这使得很难利用所有这些数据。幸运的是,Hlafreq是一个Python软件包,它可以轻松从等位基因Frequencies.net获取最新数据并为我们的分析做好准备。 (完全披露,我是Hlafreq的作者之一!)。

等位基因 hlafreq
新加坡HLA-B等位基因的Frequncy。每个研究都有自己的颜色。黑色显示了不确定性的组合估计。

用于下载,组合和绘制新加坡的HLA-B等位基因频率数据的代码如下。

结论

等位基因

参考

核酸研究 48 风湿病 53 https://doi.org/10.1101/2023.09.15.557761