生物网络通常用于生物医学和医疗保健领域,以有效地模拟复杂生物系统的结构以及连接生物实体的相互作用。然而,由于其高维和低样本量的特点,直接将深度学习模型应用于生物网络通常会面临严重的过拟合。在本文中,我们提出了一种基于 Mixup 的数据增强技术 R-Mixup,它适合生物网络邻接矩阵的对称正定 (SPD) 性质,并优化了训练效率。R-Mixup 中的插值过程利用了黎曼流形中的对数欧几里德距离度量,有效地解决了 vanilla Mixup 的膨胀效应和任意错误的标签问题。我们用五个真实的生物网络数据集在回归和分类任务上证明了 R-Mixup 的有效性。此外,我们推导出一个常被忽视的识别生物网络 SPD 矩阵的必要条件,并实证研究了其对模型性能的影响。代码实现可以在附录E中找到。
主要关键词