摘要背景:子宫子宫内膜癌(UCEC)被称为世界第六大癌症。生物信息学和深度学习的进步提供了筛查大规模基因组数据并发现指示疾病状态的潜在生物标志物的两种工具。这项研究旨在研究使用生物信息学和机器学习算法鉴定子宫诊断和预后的重要基因。方法:分析UECE患者的RNA表达谱,使用深度学习技术鉴定差异表达的基因(DEG)。预后生物标志物。此外,彻底检查了分子途径,蛋白质 - 蛋白质相互作用(PPI)网络,DEG的共表达模式及其与临床数据的关联。最终,通过基于深度学习的分析来确定诊断标记。结果:根据我们的发现,MEX3B,CTRP2(C1QTNF2)和AASS是UCEC的新生物标志物。评估指标证明了深度学习模型的功效(DNN)功效,最小平均平方误差(MSE)为5.1096067E-5,而根平方误差(RMSE)为0.007,表示准确的预测。0.99的R平方值强调了该模型解释数据中差异的很大一部分的能力。因此,该模型在曲线(AUC)下达到了一个完美的区域,表示特殊的歧视能力,精度率为97%。因此,确定新的UCEC生物标志物有望有效护理,改善预后和早期诊断。结论:GDCA数据库和深度学习算法确定了3个重要基因-MEX3B,CTRP2(C1QTNF2)和AASS,是UCEC的潜在诊断生物标志物。关键词:子宫语料库子宫内膜癌,深度学习,生物标志物,生物信息学分析,UCEC利益冲突:无宣布的资金:这项研究得到了Shahid Beheshti医学科学大学的资助和支持。*这项工作已根据CC BY-NC-SA 4.0许可发布。版权所有©伊朗医学科学大学引用本文的引用:Valizadeh Laktarashi H,Rahimi M,Rahimi M,Abrishamifar K,Mahmoudabadi A,Nazari E.使用生物学信息和机器学习对子宫中重要的诊断基因的鉴定。Med J Islam Repub伊朗。2025(1月6日); 39:4。 https://doi.org/10.47176/mjiri.39.4
(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此预印本版的版权持有人于2025年3月7日发布。 https://doi.org/10.1101/2025.03.02.641080 doi:Biorxiv Preprint
抽象密钥消息提出了一个原始的GWAS模型,该模型集成了等位基因的祖先,并允许探测背景特定的添加剂和优势QTL,涉及异性群互补性和混合性能。抽象的玉米遗传多样性被构造成彼此选择和改善的遗传群体。此过程会随着时间的流逝而增加组的互补性和分化,并确保由小组间杂交产生的杂种表现出较高的表现和异性症。为了确定与混合性能和杂种群体互补涉及的基因座,我们引入了一个原始的关联研究模型,该模型将等位基因的异性群的起源与异性构成群体分离,并将其与常规的添加剂/优势模型进行了比较。这个新模型应用于凹痕和弗林特线之间的阶乘,以及具有两种不同分析层的凹痕混合线之间的拨号线:在每个环境中和多种环境中。我们确定了所有特征的几个强大的添加剂QTL,包括一些用于开花时间的众所周知的加性QTL(在染色体8上的VGT1/2区域)。屈服特征在拨号面板中显示出显着的非加性效果。大多数检测到的产量QTL表现出过度势力或更有可能的伪过分效应。在这些QTL上明显过度污染,导致了遗传组互补性的一部分。环境之间的比较显示,添加QTL效应的稳定性高于非添加效应。我们还揭示了显示遗传群起源作用的大型染色体区域。根据局部杂种群的起源,几个QTL显示出效应的变化。总的来说,我们的结果说明了混合面板如何与专用的GWAS建模相结合,允许识别新的QTL,这些QTL无法通过通过传统建模分析的经典混合面板无法揭示的新QTL。
引言:阿尔茨海默病 (AD) 是一种进行性神经退行性疾病,全球至少有 2700 万人受其影响。这种疾病不仅严重影响患者及其家人的生活,还给社会带来沉重的经济负担。目前尚无明确的疾病改良疗法,各种疗法已被开发用于控制 AD 的症状。药物再利用是一种有价值的替代方法,可以发现已获批或正在研究的药物在其原有适应症之外的新用途。RNA 测序 (RNA-seq) 是发现疾病异质性基因表达的一种实用方法。因此,我们的研究应用了一种计算药物再利用流程,基于从 RNA-seq 数据中提取的 AD 差异基因表达特征来探索候选药物。方法与材料:从 GEO 数据库 (https://www.ncbi.nlm.nih.gov/geo/) 获取了 10 例对照和 8 例 AD 死后人类海马脑组织(登录号为 GSE173955)的表达谱。使用 GEO2R 识别 AD 与正常组织之间的差异表达基因 (DEG)。接下来,使用 LINCS 数据库识别 AD 疾病的潜在候选药物。然后,通过大量文献综述和药物研究,筛选出排名靠前的 FDA 批准药物。反过来,将 DEG 导入 STRING 数据库,以识别蛋白质之间的相互作用关联。之后,选择所有显著性综合评分为 0.7 的相互作用进行进一步分析。选择连接度最高的合适基因作为枢纽基因。靶标扫描数据库是一个专门收集 microRNA-mRNA 靶向关系的数据库。这些数据库用于获取枢纽基因相关的 miRNA。结果:本研究鉴定出 1,878 个 |log2FC| ≥ 1 且 p 值 ≤ 0.05 的基因为 DEG:909 个基因上调,969 个基因下调。能够逆转 AD 表达模式的显著改变的药物谱包括奥沙利德、莫米洛替尼和恩扎妥林。此外,S100A8 已被确定为 Cytoscape 中最突出的枢纽基因之一,在 AD 的背景下它可以被 miR-98-5p 抑制。结论和讨论:在本研究中,我们提出了几种潜在的可重新利用的候选药物,莫沙必利、莫米洛替尼和恩扎斯塔林,以及 miR-9-5p,用于治疗 AD 进展。莫沙必利目前用于治疗 2 型糖尿病、功能性消化不良、功能性便秘和上腹痛综合征。莫米洛替尼是一种 Janus 激酶 1 和 2 抑制剂,用于治疗骨髓纤维化。恩扎斯塔林已用于治疗复发性多形性胶质母细胞瘤。我们的研究结果可能指导针对不同疾病进展阶段的进一步重新利用研究。此外,我们报告 S100A8 充当炎症介质,其水平随着大脑年龄的增长而增加。MiR-98-5p 有可能抑制 AD 中的 S100A8 表达。
简介:三阴性乳腺癌(TNBC)的特征是没有雌激素受体(ER),孕酮受体(PR)和人表皮生长因子受体2(HER2)表达。它具有高度侵入性和侵略性,使其成为预后最差的乳腺癌的亚型。目前,全身化疗是主要的治疗选择,但靶向疗法仍然无法使用。因此,迫切需要确定新型的生物标志物来早期诊断和治疗TNBC。方法:我们对转录组和甲基化数据进行了综合分析,以鉴定甲基化调节的差异表达基因(MDEGS)。基因本体论(GO)分析,基因和基因组(KEGG)途径分析的京都百科全书,以及蛋白质 - 蛋白质相互作用(PPI)网络分析,以研究HUB基因对TNBC诊断和预后的影响。随后,使用逆转录定量PCR(RT-QPCR)和定量甲基化特异性PCR(QMSP),在TNBC细胞系MDA-MB-231和正常乳腺上皮细胞系MCF-10A中验证了关键基因的表达水平和DNA甲基化模式。结果:通过转录组分析积分分析确定了98个上调和87个下调基因。通过融合甲基化数据,我们进一步鉴定了22种具有高甲基化表达(甲基甲基甲基化)和32个基因,而高甲基化表达较低(高甲基化)。Kaplan-Meier生存分析表明,KIF11,CCNB1和PLK1与TNBC中较高的危险比(HR> 1,p <0.05)相关。低位级主要参与核分裂,细胞器裂变,纺锤体形成,染色体和动孔发育以及蛋白质结合。KEGG途径分析表明,这些基因富含孕酮介导的卵母细胞成熟,细胞周期调节和卵母细胞减数分裂。超高与细胞增殖,激素反应,疼痛,细胞外基质组成以及与硫化合物,肝素和糖胺聚糖的结合有关。PPI网络分析确定了七个中心基因-EXO1,KIF11,FOXM1,CENPF,CCNB1,PLK1和KIF23 - 它们在TNBC组织中都显着过表达并彼此正相关(p <0.05)。接收器的工作特性曲线分析表明,曲线下的面积(AUC)的所有七个基因都超过0.9(p <0.05),表明诊断潜力很强。体外验证实验表明,与MCF-10A细胞相比,MDA-MB-231细胞表现出较高的KIF11,CCNB1和PLK1的mRNA表达水平,而其DNA甲基化水平较低。结论:这项研究确定了七个少量级,包括EXO1,KIF11,FOXM1,CENPF,CCNB1,PLK1和KIF23,它们参与了细胞周期和有丝分裂过程的调节,并且具有TNBC的诊断生物标志物的重要性。值得注意的是,KIF11,CCNB1和PLK1的表达升高与TNBC患者的预后不良有关。这些发现有助于提高对表观遗传学分子机制的理解
COVID-19条件(PCC)及其长期症状范围的机制尚不清楚。这项研究在一年的非住院COVID-19患者的子集中研究了DNA甲基化模式,该模式持续症状和生活质量降低,称为PCC+(COVID-19疾病后加)。在22个PCC+个体和22个匹配的Covid-19康复(PCC-)的队列中,我们确定了随着时间的推移而减少的组之间的明显DNA甲基化差异。TXNRD1基因的甲基化变化与认知症状和疲劳显着相关,这暗示了PCC病理学中的氧化还原失衡。途径分析显示,PI3K-AKT和AMPK信号通路的富集,可能是二甲双胍在降低PCC发生率中观察到的效力的潜在。尽管我们发现两组之间的表观遗传年龄加速没有差异,但我们观察到RAS和RAP1信号通路的甲基化纵向变化。这些发现提供了对PCC+机制的关键见解,并将氧化应激途径作为治疗干预的有希望的目标。
本工作论文构成了OECD发展援助委员会的子公司,是反腐败任务团队(ACTT)的主持下的多年工作计划“非法金融流量和石油商品交易”的一部分。工作论文描述了作者的初步结果或正在进行的研究,并发表了有关经合组织在其中工作的广泛问题的讨论。本工作文件不应报告为代表经合组织或其成员国的官方观点。表达的意见和所采用的论点是作者的观点。工作文件应用了团队作为ERC Advanced G Rant的一部分开发的比较法医方法:公司套利和CPL地图:全球经济中控制的隐藏结构(Corplink)。授予号。69494。我们要感谢凯瑟琳·安德森(Catherine Anderson),面团波特(Dough Porter),丽贝卡·恩格布森(Rebecca Engebretsen),迈克尔·沃茨(Michael Watts),菲尔·库尔伯特(Phil Culbert),奥利娜·艾萨瓦(Olena Isaeva),他们对商品贸易和IFF的复杂世界的专家洞察力以及他们对早期出版草案的建议和评论。
摘要:亲自识别,重新排列是通过完善检索结果的初始排名来提高整体准确性的关键步骤。先前的研究主要集中在单视图像的特征上,这些特征可能会导致偏见和诸如姿势变化,观点变化和遮挡等问题。使用多视图来介绍一个人可以帮助减少视图偏差。在这项工作中,我们提出了一种有效的重新级别方法,该方法通过使用K-Neartivt加权融合(KWF)方法来汇总邻居的功能来生成多视图特征。具体来说,我们假设从重新识别模型中提取的特征在表示相同的身份时高度相似。因此,我们以无监督的方式选择K相邻功能来生成多视图功能。此外,本研究探讨了特征聚合过程中的重量选择策略,从而使我们能够确定有效的策略。我们的重新排列方法不需要模型进行微调或额外的注释,因此它适用于大规模数据集。我们在重新识别数据集Market1501,MSMT17和遮挡的dukemtmc上评估我们的方法。结果表明,从初始排名结果中重新列出顶级M候选者时,我们的方法会显着提高列表@1并映射。具体而言,与初始结果相比,我们的重新排列方法在具有挑战性的数据集中,等级@1的提高分别为9.8% / 22.0%:MSMT17和闭塞性dukemtmc。此外,我们的方法证明了与其他重新排列方法相比,计算效率的实质性提高。
人类如何实现如此高度的亲社会行为是一个引人注目的主题。探索人类亲社会性的神经基础已在近几十年来引起了人们的重大关注。然而,人类亲身社会性的基础神经机制仍有待阐明。为了解决这一知识差距,我们分析了15场经济游戏中的多模式脑成像数据和数据。结果揭示了大脑特征和亲社会行为之间的几个重要关联,包括较强的半球连通性和较大的call体体积。更大的功能分离和整合,以及较少的髓磷脂图与较厚的皮质相结合,与亲社会行为有关,尤其是在社会大脑区域内。当前的研究表明,这些指标是人类亲社会行为的大脑标志物,并为人类亲社会行为的结构和功能性大脑基础提供了新的见解。
摘要:蛋白质和糖含量在大豆中是重要的种子质量特征,因为它们可以提高大豆食品和饲料产品的价值和可持续性。因此,通过通过标记辅助选择来加速育种过程,鉴定大豆种子蛋白和糖含量的定量性状基因座(QTL)可以使植物育种者和大豆市场受益。在这项研究中,从R08-3221(高蛋白质和低蔗糖)和R07-2000(高蔗糖和低蛋白质)之间的十字架开发了重组近交系(RIL)。蛋白质含量的表型数据取自F2:4和F2:5代。DA7250 NIR分析仪和HPLC仪器用于分析总种子蛋白和蔗糖含量。基因型数据是使用Soysnp6k芯片分析生成的。在这项研究中总共确定了四个QTL。蛋白质含量的两个QTL位于11和20染色体上,两个与蔗糖含量相关的QTL位于染色体14和。11,后者与检测到的蛋白质QTL共定位,解释了研究人群中大豆种子中蛋白质和蔗糖含量的10%的表型变异。大豆育种计划可以使用结果来提高大豆种子质量。