最近的研究强调了基因组研究缺乏多样性。然而,人们对表观基因组学的关注较少。在本文中,我们表明表观基因组学研究缺乏多样性,并提出了解决这一问题的几种解决方案。在不同人群中进行研究对于了解疾病病因和风险至关重要。最近的一些出版物强调了遗传研究缺乏种族或民族多样性,并呼吁在不同人群中进行更多研究 1,2 。然而,人们对表观基因组学的关注较少。在过去十年中,通过国际人类表观基因组联盟 (IHEC) 的努力,在对调控元件的理解方面取得了巨大进展,该联盟绘制了各种组织和细胞类型中的调控元件,并向科学界免费开放了许多这些数据集 3 。这个全面的顺式调控元件和染色质数据集目录已被证明可用于不同领域,例如基因组变异注释 4 、基因位点的精细定位 5 、基因组编辑方法 5 和单细胞测序分析流程的设计 6 。目前关于 IHEC 样本的种族或民族的信息很少。我们在公开的 IHEC 数据集中查询了与种族/民族和原籍国有关的不同统计指标,发现只有 42.7% 的实验报告了任何种族或民族信息(补充表 1 ,从 https://www.encodeproject.org/ 下载;我们使用了基于美国的 ENCODE 数据,因为它是 IHEC 内唯一公开的数据集)。在 5,048 项具有种族或族裔信息的公开实验中,87.1%(n=4,397)被标记为“欧洲人”,9.3%(n=470)被报告为非洲人、非裔美国人或黑人,1.7%(n=87)有亚洲血统,其余(1.9%,n=94)有其他血统或多种种族/族裔身份的组合,这表明用于分析的样本存在相当大的差异(补充表 1)。从 2009 年到 2021 年,“欧洲人”样本的累计实验数量有所增加,远远超过