图2。corex基因(a,b)验证验证核心基因预测值的验证。精度表示真正是eCDNA(+)的预测样品的比例。召回是指正确预测的eCDNA(+)样品的比例。对于具有相似精度的多个点,绘制了最大召回率。(a)核心基因和核心基因的曲线重叠,表明相似的预测能力。(b)Corex基因具有较高的预测率,并且基于对数折叠的折叠变化(TOP-| LFC |基因)的643个差异表达基因。(c)Corex基因在肿瘤类型的ECDNA(+)样品中始终在肿瘤样品中持续上调,但SARC除外。(d)的643 top- | lfc |基因,240个上调,而403个在ECDNA(+)样品中下调。325上调,而318个下调。top- | lfc |的绝对LFC值基因集明显大于核心基因的基因(p值1.83E -158)。(e)Corex基因的归一化基因表达值显着高于Top-| LFC |的基因表达值。基因集(p -Value <2E -308)。*** p -Value <0.001。
开源代码贡献: Github 统计:17 个公共存储库,拥有超过 1400 个“star”和超过 250 个“fork”(不包括对学生开发的存储库提供建议) 一些代码已移植到 autoML 系统中,网址为 http://datadrivendiscovery.org 具有非牛顿动量的汉密尔顿动力学用于快速采样 2021 https://github.com/gregversteeg/esh_dynamics 使用线性 CorEx 进行线性因子模型和协方差估计 2017 https://github.com/gregversteeg/linearcorex 针对欠采样、高维生物医学数据优化的非线性 CorEx 模型。 2017 https://github.com/gregversteeg/bio_corex 使用 CorEx 构建主题模型 2016 https://github.com/gregversteeg/corex_topic 离散信息筛选 2016 https://github.com/gregversteeg/discrete_sieve 高斯化数据 2015 https://github.com/gregversteeg/gaussianize 信息论深度学习: 2014 https://github.com/gregversteeg/CorEx 非参数信息论估计代码: 2013 https://github.com/gregversteeg/NPEET