Loading...
机构名称:
¥ 3.0

交叉数据测试对于检查机器学习(ML)模型的性能至关重要。但是,大多数关于转录组和临床数据建模的研究仅进行了数据内测试。还不清楚归一化和非差异表达基因(NDEG)是否可以改善ML的跨数据库建模性能。因此,我们旨在了解归一化,NDEG和数据源是否与ML在跨数据库测试中的性能有关。使用了TCGA和ONCOSG中肺腺癌病例共享的转录组和临床数据。仅使用转录组数据就达到了最佳的跨数据库ML性能,并且在统计学上比使用转录组和临床数据更好。最佳平衡精度(BA),曲线下的面积(AUC)和在TCGA上的ML算法培训中的精度明显高于ONCOSG的测试,而在ONCOSG上进行了测试并在TCGA上进行了测试(所有人的P <0.05)。归一化和NDEG在两个数据集中大大改善了数据集中的ML性能,但在跨数据库测试中却没有。引人注目的是,单独对ONCOSG的转录组数据进行建模优于建模转录组和临床数据,而TCGA中包括临床数据的转录组和临床数据并没有显着影响ML性能,这表明TCGA中转录量数据的临床数据值有限或转录量的倒数影响。在数据内测试中的性能提高更为明显。在比较的六个ML模型中,支持矢量机是在数据集和跨数据库测试中最常见的表现最常见的。因此,我们的数据显示了数据源,归一化和NDEG在建模转录组和临床数据中与数据集和跨数据库ML性能相关。

归一化的关联,非差异表达

归一化的关联,非差异表达PDF文件第1页

归一化的关联,非差异表达PDF文件第2页

归一化的关联,非差异表达PDF文件第3页

归一化的关联,非差异表达PDF文件第4页

归一化的关联,非差异表达PDF文件第5页

相关文件推荐

2025 年
¥1.0
2024 年
¥1.0
2018 年
¥12.0
2018 年
¥12.0
2018 年
¥12.0
2024 年
¥1.0
2024 年
¥3.0
2004 年
¥1.0
2022 年
¥1.0
2024 年
¥1.0