抽象不完整的渗透性是孟德尔病的规则而不是例外。在综合症单基因疾病中,表型变异性可以看作是多个独立临床特征的不完全渗透性的组合。在遗传学相同的个体中,例如等源性模型生物,根据遗传阈值模型,分子和细胞水平的随机变化是渗透不完全渗透的主要原因。通过定义因果生物学读数和遗传责任值的特定概率分布,随机性和不完整的渗透率提供了有关生物系统中阈值的信息。通过同时对相对简单的表型和单个细胞水平的分子读数进行定量,可以确定阈值的确定阈值。然而,仅使用实验和还原主义方法,对于复杂的形态表型而言,这是更具挑战性的,在这种方法上,因果和效应在时间上分开以及多种生物学模式和尺度。在这里,我考虑如何将观察数据与高置信度因果模型整合在一起的因果推断,可以用来量化不同随机变化来源对表型多样性的相对贡献。总体而言,这些方法可以为疾病机制提供依据,改善了临床结果的预测,并优先考虑基因功能模式和尺度的基因治疗靶标。
电磁干扰 (EMI) 有望成为飞行电子系统不断演变的问题。本文介绍了 EMI 并确定了其对民航无线电系统的影响。新的无线服务,如移动电话、短信、电子邮件、网页浏览、射频识别 (RFID) 和移动音频/视频服务,现在正被引入客机。本文介绍了 FCC 和 FAA 管理飞机上移动电话和其他便携式电子设备 (PED) 使用的规则,并介绍了这些规则现在如何被重写以更好地促进机上无线服务。本文全面概述了 NASA 与 FAA、RTCA、航空公司和大学的合作研究,以获取多种 PED 类型的实验室辐射发射数据、飞机射频 (RF) 耦合测量、估计的飞机无线电干扰阈值和直接影响 EMI 测试。这些元素结合在一起,提供了有关客机上使用的新型无线产品的 EMI 潜力的高置信度答案。本文提出了通过检测、评估、控制和减轻 EMI 的影响来协调新型无线服务与航空无线电服务的愿景。
小麦(Triticum aestivum)是最重要的食品作物之一,迫切需要增加其生产以养活不断增长的世界。triticum timopheevii(2n = 4x = 28)是一种同种二磷酸小麦野生物种,其中包含许多在小麦改善的预育前期计划中被利用的A T和G基因组。在这项研究中,我们报告了基于PACBIO HIFI读取和染色体构象捕获(HI-C)的T。Imopheevii登录PI 94760的染色体规模参考基因组组装。组件包含9.35 GB的总尺寸,其重叠群为42.4 MB,并包括线粒体和质体基因组序列。基因组注释预测了166,325个基因模型,其中包括70,365个基因,具有高置信度。DNA甲基化分析表明,G基因组的平均甲基化碱基比A T基因组更多。总而言之,T。timopheevii基因组组装为基因组知情发现农艺安全基因的粮食安全基因提供了宝贵的资源。
N-亚硝胺药物杂质是FDA关注的重点,尤其是由药物本身形成的亚硝胺杂质,称为N-亚硝胺药物相关杂质或NDSRI。杂质可以在药物生命周期的任何时间形成,例如作为合成副产物、在储存过程中以及在接受治疗的患者体内产生的NDSRI。使用突变试验可以识别可能增加癌症风险的N-亚硝胺杂质;具有致突变性的N-亚硝胺被认为是致癌物质,在药物中的含量被控制在非常低的水平。因此,FDA开发能够识别致突变N-亚硝胺的测试模型非常重要。DGMT科学家与药物评估和研究中心(CDER)亚硝胺药物杂质工作组合作,使用体外细菌和人类细胞突变试验评估一系列小分子N-亚硝胺和NDSRI的致突变性和遗传毒性。此外,还使用二维 (2D) 和三维 (3D) 人类肝细胞 (HepaRG) 模型测试了八种不同的 N-亚硝胺的遗传毒性。最后,对不同的 N-亚硝胺在转基因啮齿动物中的致癌性进行了评估。这些研究的目的是开发筛选和后续检测方法,以高置信度确定 N-亚硝胺药物杂质的癌症风险。以下出版物描述了这些研究的结果:Regul Toxicol Pharm 和 Arch Toxicol。
摘要 藜麦种质保留了有用且大量的遗传变异,但由于缺乏现代育种工具的实施,这一遗传变异仍未得到开发。我们整合了田间和序列数据,以表征藜麦的大量多样性。310 个种质的全基因组测序揭示了 290 万个多态性高置信度单核苷酸多态性 (SNP) 基因座。高地和低地藜麦聚集成两个主要群体,F ST 发散度为 0.36,连锁不平衡 (LD) 衰减分别为 6.5 和 49.8 kb。一项使用多年表型试验的全基因组关联研究发现了与 17 种性状稳定相关的 600 个 SNP。两个候选基因与千粒重相关,一个抗性基因类似物与霜霉病抗性相关。我们还确定了四种对适应性很重要的农艺性状的多效作用基因座。这项工作展示了使用部分驯化的孤儿作物重新测序数据来快速识别标记性状关联,并为基因组学支持的藜麦育种提供基础元素。
使用自私遗传元件(SGE)抽象的拮抗剂进化可以推动宿主抗性的进化。在这里,我们研究了宿主抑制2微米(2 m)质粒,质质寄生虫,它们与萌芽的酵母菌共同发展。我们开发了SCAMPR(用于测量质粒保留的单细胞测定),以测量活细胞中拷贝数异质性和2 m质粒损失。我们确定了缺乏内源性2 M质粒并可重复抑制有丝分裂质粒稳定性的三种酿酒酵母菌株。着眼于Y9 Ragi菌株,我们确定质粒限制是可遗传的和占主导地位的。使用大量分离分析,我们确定了一个高置信度定量特质基因座(QTL),其单个变体MMS21与增加2 m的不稳定性相关。MMS21编码SMC5/6复合物的SUMO E3连接酶和一个重要组成部分,涉及姐妹染色单体内聚,染色体分离和DNA修复。我们的分析利用自然变异来揭示出一种新颖的手段,萌芽的酵母可以克服非常成功的遗传寄生虫。
摘要 抗 CRISPR(Acr)蛋白由(原)病毒编码,以抑制其宿主的 CRISPR-Cas 系统。编码 Acr 和 Aca(Acr 相关)蛋白的基因通常共定位以形成 acr-aca 操纵子。在这里,我们提出 AcaFinder 作为第一个 Aca 基因组挖掘工具。AcaFinder 可以 (i) 使用关联理论 (GBA) 预测 Acas 及其相关的 acr-aca 操纵子;(ii) 使用 HMM(隐马尔可夫模型)数据库识别已知 Acas 的同源物;(iii) 获取潜在原噬菌体、CRISPR-Cas 系统和自靶向间隔区 (STS) 的输入基因组;(iv) 提供独立程序(https://github.com/boweny920/AcaFinder)和 Web 服务器(http://aca.unl.edu/Aca)。 AcaFinder 被用于挖掘 16,000 多个原核生物和 142,000 个肠道噬菌体基因组。经过多步过滤,鉴定出 36 个高置信度的新 Aca 家族,是已知 12 个 Aca 家族的三倍。七个新的 Aca 家族来自人类主要肠道细菌(拟杆菌门、放线菌门和梭杆菌门)及其噬菌体,而大多数已知的 Aca 家族来自变形菌门和厚壁菌门。通过分析 Acrs 和 Acas 的操纵子共定位,揭示了它们之间复杂的关联网络。相同的 aca 基因可以与不同的 acr 基因重组,反之亦然,从而形成不同的 acr-aca 操纵子组合,这在进化过程中似乎很常见。
摘要:脑脊液(CSF)是发现神经系统疾病生物标志物的重要基质。然而,CSF中蛋白质浓度的高动态范围阻碍了不靶向的质谱法检测最少丰富的蛋白质生物标志物。因此,对大脑内部的分泌过程有更深入的了解是有益的。在这里,我们旨在探讨脑蛋白是否以及如何预测CSF的分泌。通过将策划的CSF蛋白质组和人蛋白质图集的脑升高蛋白质组相结合,将脑蛋白分类为CSF或非CSF分泌。机器学习模型接受了一系列基于序列的特征的培训,以区分CSF和非CSF组,并有效地预测蛋白质的大脑起源。分类模型如果使用高置信度CSF蛋白,则在曲线下达到0.89的面积。最重要的预测特征包括亚细胞定位,信号肽和跨膜区域。分类器良好地概括为较大的大脑检测到的蛋白质组,并能够正确预测通过亲和力蛋白质组学鉴定的新型CSF蛋白。除了阐明蛋白质分泌的潜在机制外,受过训练的分类模型还可以支持生物标志物候选者的选择。关键字:脑蛋白质组,脑脊液,流体生物标志物,机器学习,蛋白质分泌■简介
摘要 背景 检查点靶点在肿瘤介导的免疫逃逸中起着关键作用,因此对癌症免疫治疗至关重要。不幸的是,缺乏汇编所有检查点靶点以用于免疫肿瘤学中的转化研究和药物发现的生物信息学资源。 方法为此,我们开发了检查点治疗靶点数据库 (CKTTD),这是第一个针对免疫检查点靶点(蛋白质、miRNA 和 LncRNA)及其调节剂的综合数据库。采用评分系统以高置信度筛选更多相关靶点。此外,Oncomine、Drugbank、miRBase 和 Lnc2Cancer 数据库等一些生物数据库被集成到 CKTTD 中,以提供深入的信息。此外,我们计算并提供了所有靶点的配体结合位点信息,这可能为基础科学家进行药物发现工作提供支持。结果 CKTTD 总共汇编了 105 个检查点蛋白靶点、53 个调节剂(小分子和抗体)、30 个 miRNA 和 18 个 LncRNA,这些实验证据均通过增强型文本挖掘系统从 10 649 篇文献中整理出来,这些证据均经过验证。 结论 总之,CKTTD 可以作为癌症免疫治疗和药物发现研究的有用平台。CKTTD 数据库可在 http://www.ckttdb.org/ 上免费向公众开放。
隧道施工引起的建筑物损坏评估是一个复杂的土壤-结构相互作用 (SSI) 问题,受土壤和结构的众多几何和材料参数的影响,具有强烈的非线性行为特征。目前,人们倾向于使用机器学习 (ML) 开发数据驱动模型来捕捉这种复杂行为。鉴于真实数据(通常来自特定案例研究)的稀缺性,许多研究人员已转向通过复杂且经过验证的数值模型(如有限元法 (FEM))创建大量合成数据集。然而,这些数据集的开发和高级 ML 算法的训练带来了重大挑战。带来了重大挑战。仅依赖案例研究得出的参数域和范围可能会导致数据分布不平衡,从而导致模型在人口较少的地区表现不佳。在本文中,我们介绍了一种通过迭代过程设计最佳高置信度数据集的策略。这个过程从系统的文献综述开始,以确定参数、它们的范围和依赖关系对 SSI 引起的建筑物损坏的重要性。从数百次 FEM 模拟开始,我们生成初始数据集,并通过敏感性分析 (SA) 研究、统计建模和在统计显著区域重新采样来评估其质量和影响。通过这种评估,我们可以改进模型的输入空间,寻找缓解输出分布不平衡的方案。重复该过程,直到数据集达到训练元模型的令人满意的平衡,从而有效地最大限度地减少偏差。我们的研究结果突出了这种方法在确定最佳和可行输入空间方面的成功,从而显著减少了输出特征的不平衡分布。这种方法不仅在我们的研究中被证明是有效的,而且还提供了一种通用的方法,可以适用于旨在生成高质量合成数据集的其他学科。