我们旨在开发和验证一种新的图嵌入算法,用于嵌入药物-疾病-靶点网络以生成新的药物再利用假设。我们的模型将药物、疾病和靶点分别表示为主语、谓语和宾语。每个实体都由一个多维向量表示,谓语被视为从主语到宾语向量的平移向量。这些向量经过优化,以便当主语-谓语-宾语三元组表示已知的药物-疾病-靶点关系时,主语和谓语之间的总和向量应接近宾语的向量;否则,总和向量远离宾语。DTINet 数据集用于测试该算法并发现药物和疾病之间的未知联系。在交叉验证实验中,这种新算法优于原始 DTINet 模型。我们模型的 MRR(平均倒数排名)值约为 0.80,而原始模型的 MRR(平均倒数排名)值约为 0.70。此外,我们还识别并验证了几对新的治疗关系以及原始 DTINet 数据集中未记录的副作用关系。这种方法表现出色,预测的药物-疾病和药物-副作用关系与文献报道一致。这种新方法可用于分析各种类型的新兴生物医学和医疗保健相关知识图谱 (KG)。
图1。DDT网络中层次结构的插图。以DTINET 116中的药物节点DB00050为例,它可以直接与两个靶点节点P30968和P22888结合,它也可以通过110个基于药物疾病的疾病节点和118