Loading...
机构名称:
¥ 1.0

了解疾病的遗传基础是医学研究的一个基本方面,因为基因是遗传的经典单位,并且在生物学功能中起着至关重要的作用。鉴定基因与疾病之间的关联对于诊断,预防,预后和药物发育至关重要。基因通常与相关疾病有关,因为引起相同或相似疾病的蛋白质往往显示出有限的序列变化。预测基因 - 疾病酶关联(GDA)需要对大量潜在候选基因进行耗时且昂贵的实验。尽管已经提出了使用传统的机器学习算法和图形神经网络来预测基因与疾病之间的关联的方法,但这些方法努力捕获基因和疾病中的深层语义信息,并取决于训练数据。为了减轻此问题,我们提出了一个名为FusionGDA的新型GDA预测模型,该模型利用带有融合模块的训练阶段来丰富由预训练的语言模型编码的基因和疾病语义表示。多模式表示由融合模块产生,其中包括有关两个异质生物医学实体的丰富语义信息:蛋白质序列和疾病描述。随后,采用了汇总聚合策略来压缩多模式表示的维度。此外,FusionGDA采用了训练阶段,利用对比度学习损失来通过在大型公共GDA数据集中进行培训来提取潜在的基因和疾病特征。为了严格评估FusionGDA模型的有效性,我们在五个数据集上进行了全面的实验,并将我们所提出的模型与Disganet-Eval数据集上的五个竞争基线模型进行了比较。值得注意的是,我们的案例研究进一步证明了FusionGDA有效发现隐藏关联的能力。我们实验的完整代码和数据集可在https://github.com/zhaohanm/fusiongda上找到。

反复练习的反复发作的运动单位行为的变化

反复练习的反复发作的运动单位行为的变化PDF文件第1页

反复练习的反复发作的运动单位行为的变化PDF文件第2页

反复练习的反复发作的运动单位行为的变化PDF文件第3页

反复练习的反复发作的运动单位行为的变化PDF文件第4页

反复练习的反复发作的运动单位行为的变化PDF文件第5页

相关文件推荐