摘要:表型包括应用算法来识别与特定,潜在复杂,性状或条件相关的个人,通常是从电子健康记录(EHRS)集合中的。由于EHR的许多临床信息都在文本中,因此文本的表型在依赖EHR的次要使用的研究中起着重要作用。但是,临床文本的内容和形式的异质性和高度专业化的方面使这项任务特别繁琐,并且是观察研究中时间和成本限制的来源。为了促进表型管道的开发,评估和可重复性,我们开发了一个名为MED KIT的开源Python库。它可以启用由易于重复使用软件砖制成的数据处理管道,名为MedKit Operations。除了图书馆的核心外,我们还共享我们已经开发的运营和管道,并邀请表型社区重新使用和丰富。
✉材料的信件和请求应向约瑟夫·D·布克斯鲍姆(Joseph D. Buxbaum),马克·J·戴利(Mark J.joseph.buxbaum@mssm.edu; mjdaly@atgu.mgh.harvard.edu; devlinbj@upmc.edu; roeder@andrew.cmu.edu; stephan.sanders@ucsf.edu; mtalkowski@mgh.harvard.edu。*作者及其隶属关系列表出现在本文的末尾。作者贡献M.E.T.,S.J.S,K.R.,B.D.,M.J.D,J.D.B。和S.B.G.设计了研究。M.E.T.,M.J.D.,J.D.B.,S.D.R.,S.B.G.,S.D. A.R.,F.T.,E.T.,G.C.,M.C.Y.C.,C.F.,E.G.,A.C.G. J.S.S.,E.H.C。和C.B.贡献了样本和生成的数据。M.E.T.,S.J.S.,M.J.D.,J.D.B.,S.D.R.,L.S.,B.M.,C.R.S. 和B.C. 协调的项目管理。 M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,D.J.C.,E.B.,A.N.S. S.D.,R.L.C.,H.B.,M.P.,F.K.S。 和J.M.F. 开发了方法论并进行了分析。 M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,J.D.B.,H.B.,M.P.,F.K.S。 和J.M.F. 写了这篇论文。M.E.T.,S.J.S.,M.J.D.,J.D.B.,S.D.R.,L.S.,B.M.,C.R.S.和B.C.协调的项目管理。M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,D.J.C.,E.B.,A.N.S. S.D.,R.L.C.,H.B.,M.P.,F.K.S。 和J.M.F. 开发了方法论并进行了分析。 M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,J.D.B.,H.B.,M.P.,F.K.S。 和J.M.F. 写了这篇论文。M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,D.J.C.,E.B.,A.N.S.S.D.,R.L.C.,H.B.,M.P.,F.K.S。 和J.M.F. 开发了方法论并进行了分析。 M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,J.D.B.,H.B.,M.P.,F.K.S。 和J.M.F. 写了这篇论文。S.D.,R.L.C.,H.B.,M.P.,F.K.S。和J.M.F.开发了方法论并进行了分析。M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,J.D.B.,H.B.,M.P.,F.K.S。 和J.M.F. 写了这篇论文。M.E.T.,S.J.S.,K.R.,B.D.,M.J.D.,J.D.B.,H.B.,M.P.,F.K.S。和J.M.F.写了这篇论文。
线虫秀丽隐杆线虫是生物学研究中的关键模型生物,因为它与人类的遗传相似性及其在研究复杂过程中的效用。传统的图像分析方法(例如使用ImageJ的方法)是劳动密集型的,这导致了AI的整合。本研究介绍了一个具有三种机器学习模型的AI框架:Wor-Mgan,一种生成对抗网络,用于生成合成线虫图像以增强训练数据;蠕虫,用于精确运动跟踪;和蠕虫,以进行准确的解剖测量。一起,这些工具显着提高了表型分析的效率和准确性。wor-mai具有高通量数据集分析的巨大潜力,在系统生物学,药物发现和衰老方面进行了研究。该框架简化了工作流程,可以在秀丽隐杆线虫研究中更快,更精确的发现。
我们旨在开发系统性硬化症(SSC)子类型分类器工具,以在患者的床边使用。我们比较了静止(5分钟)的心率变异性(HRV),并响应于具有弥漫性(n = 16,DCSSC)和有限(n = 38,LCSSC)的患者(n = 58)的正抑制(5分钟)(n = 58)。在时间,频率和非线性域中从Beat-Beat RR间隔中评估HRV。DCSSC组与LCSSC组不同,主要是较高的心率(HR)和较低的HRV,在depubitus和正稳态条件下。站立机动降低了HR标准偏差(SD_HR),Poincaré拟合椭圆的RR间隔图(SD2)的主要轴长以及DCSSC组中的相关维度(CORDIM),而LCSSC组中这些HRV索引增加了(P = 0.004,P = 0.004,p = 0.002,以及增加了这些HRV指数。我们确定了5个最有用和判别的HRV变量。We then compared 341 classifying models (1 to 5 variables combinations × 11 classifier algorithms) according to mean squared error, logloss, sensitivity, specificity, precision, accuracy, area under curve of the ROC-curves and F1-score.f1得分范围从最佳1-可添加模型的0.823到4个变量最佳模型的最大0.947。最具体和精确的模型包括SD_HR,SD2和Cordim。总而言之,我们提供了高性能分类模型,能够从ECG记录中区分易于在床边执行的有限皮肤SSC子类型。模型基于1至5 HRV索引用作自主综合影响心脏活动的非线性标记。
摘要 - 胰腺导管腺癌(PDAC),占胰腺肿瘤的90%的占90%的特征,其预后不良,5年生存率仅为12%。大多数患者被诊断出患有转移性或局部晚期疾病,只有15%有资格进行治疗切除术。PDAC表现出对化学疗法,靶向疗法和免疫疗法的抗性,这主要是由于其高度异质性肿瘤微环境(TME)。在这项研究中,我们对公开可用的SCRNA,空间转录组学和批量RNA测序数据集进行了整合分析,以研究TME组成和肿瘤结构对PDAC进展,治疗反应,治疗反应和临床结果的影响。我们确定了具有不同细胞组成,功能特征和免疫调节性细胞 - 细胞相互作用的TME亚型。在空间上不同的细胞壁细分市场和基因模块揭示了原发性肿瘤和转移性病变的异质性。发现与患者生存相关的独特集群,为TME生物学及其临床意义提供了新的见解。这些发现强调了整合多摩管方法以揭示PDAC TME复杂性的重要性,并强调了其为治疗策略提供信息并改善患者结果的潜力。
摘要背景:使用预测基因标志来协助临床决策变得越来越重要。深度学习在基因表达谱的表型预测中具有巨大的潜力。但是,神经网络被视为黑匣子,在没有任何解释的情况下,提供了准确的预测。这些模型变得可解释的要求正在增加,尤其是在医学领域。结果:我们专注于解释由基因表达数据构建的深神经网络模型的预测。影响预测的最重要的神经元和基因被鉴定出来并与生物学知识有关。我们对CAN-CER预测的实验表明:(1)深度学习方法优于大型训练集的经典机器学习方法; (2)我们的方法产生的解释与生物学比最先进的方法更连贯; (3)我们可以对生物学家和医生的预测提供全面的解释。结论:我们提出了一种原始方法,用于从基因表达数据中对表型预测深度学习模型的生物学解释。由于模型可以找到表型和基因表达之间的关系,因此我们可以假设已鉴定的基因与表型之间存在联系。因此,解释可以导致生物学家研究新的生物学假设。
菲洛巴氏菌(Filobasidium)属,是菲洛巴·西迪亚斯(Filoba Sidiales)的家族丝虫科的成员,是一组具有许多代表性物种的基本菌。迄今为止,已经在菲洛巴氏菌中描述并接受了14种。尽管最近发表了一些来自中国的新发现,但丝状岛的物种多样性仍未完全理解。样品,并检查了该属的物种多样性。三个新物种,即F. pseudomali sp。nov。 ,F。Castaneaesp。nov。和F. Qingyuanense sp。nov。基于内部转录间隔物(ITS)的系统发育分析以及大亚基(LSU)rRNA基因的D1/D2结构域以及其单独的序列与表型特征相连。提供了完整的描述,插图,与类似物种的比较以及系统发育分析。这项研究的发现实质上丰富了中国菲洛巴氏菌的生物多样性。
自闭症谱系障碍的主要驱动因素之一是数百个基因内的风险等位基因,它们可能在共享但未知的蛋白质复合物中相互作用。在这里,我们开发了一种可扩展的基因组编辑介导的方法来靶向小鼠大脑内的14个高强烈的自闭症风险基因,用于基于接近性的内源性蛋白质组学,从而实现了高特异性空间蛋白质组织的识别。产生的天然接近蛋白质组富含自闭症个体大脑失调的人类基因,并揭示了来自高强调风险基因与低调的蛋白质之间的接近性相互作用,这些蛋白质与较低信号的蛋白质之间可能提供新的途径,从而可以为遗传风险确定优先确定遗传风险。重要的是,数据集丰富了可能构成条件的共享旋转功能和遗传相互作用。我们通过两个自闭症模型中的空间蛋白质组学和基于CRISPR的表达调节来测试这一概念,证明了调节其失调机制的功能相互作用。一起,这些结果揭示了与自闭症相关的体内蛋白质组网络,从而为理解和操纵其病因的细胞驱动器提供了新的侵害。
1美国贝勒医学院分子和人类遗传学系,美国德克萨斯州休斯敦,美国2号,美国2定量和计算生物科学研究生课程,贝勒医学院,贝勒医学院,德克萨斯州休斯敦77030,美国3 Verna and Marrs McLean McLean McLean生物化学和分子生物学系,Baylor Biology of Medicine,Baylor Biology,Baylor Biologure,Baylor carry and Carry Inituce,HouSton,HouSton,TX 770030,TX 7700030美国德克萨斯州休斯敦市贝勒医学院,美国,美国,美国,美国,美国,贝勒医学院5计算和综合生物医学研究中心,美国德克萨斯州休斯敦贝勒医学院,美国德克萨斯州77030,美国 *通信地址。美国贝勒医学院分子和人类遗传学系,美国德克萨斯州休斯敦,美国,美国,美国,美国。 电子邮件:chen.wang@bcm.edu(C.W。) 和lichtarge@bcm.edu(O.L.) 副编辑:Russell Schwartz美国贝勒医学院分子和人类遗传学系,美国德克萨斯州休斯敦,美国,美国,美国,美国。电子邮件:chen.wang@bcm.edu(C.W。)和lichtarge@bcm.edu(O.L.)副编辑:Russell Schwartz
图S2。 通过蛋白质印迹评估的GADD45αshRNA的沉默效率。 gADD45α蛋白表达水平在(a)MHCC -97H和(b)用NC和三个靶向GADD45α的SHRNA后的HUH7细胞中。 基于GADD45α蛋白的表达,SH2的沉默是最重要的,用于随后的实验。 数据表示为平均值±SD(n = 3)。 ** p <0.01。 GADD45α,生长停滞和DNA损伤诱导α; NC,阴性对照; SH,短发夹。图S2。通过蛋白质印迹评估的GADD45αshRNA的沉默效率。gADD45α蛋白表达水平在(a)MHCC -97H和(b)用NC和三个靶向GADD45α的SHRNA后的HUH7细胞中。基于GADD45α蛋白的表达,SH2的沉默是最重要的,用于随后的实验。数据表示为平均值±SD(n = 3)。** p <0.01。GADD45α,生长停滞和DNA损伤诱导α; NC,阴性对照; SH,短发夹。