简单总结:草鱼Ctenopharyngodon idellus是我国重要的淡水养殖硬骨鱼类,年产量达5,533,083吨,但由草鱼呼肠孤病毒(GCRV)引起的出血病严重制约了草鱼的养殖。为了更好地控制草鱼出血病,基于抗病毒免疫分子标记的抗性草鱼品系的培育是一种潜在的解决方案。然而,草鱼抗GCRV感染的分子基础仍然很大程度上未知,大大限制了抗出血病草鱼的培育。鉴于三部分基序蛋白(TRIM)在动物抗病毒免疫中的重要性,我们利用隐马尔可夫模型生物序列分析软件(HMMER)和SMART对草鱼基因组中的TRIM进行鉴定,并分析其基因位点、结构和进化特征。我们还尝试基于两组转录组揭示草鱼在GCRV感染过程中的抗病毒TRIM及其介导的免疫过程。本研究为了解草鱼的TRIM和抗病毒免疫提供了信息。
摘要 动机 在序列中寻找概率基序是注释假定转录因子结合位点 (TFBS) 的常见任务。有用的基序表示包括位置权重矩阵 (PWM)、双核苷酸 PWM (di-PWM) 和隐马尔可夫模型 (HMM)。双核苷酸 PWM 结合了 PWM 的简单性(矩阵形式和累积评分函数),但也加入了基序中相邻位置之间的依赖关系(不同于忽略任何依赖关系的 PWM)。例如,为了表示结合位点,HOCOMOCO 数据库提供了来自实验数据的 di-PWM 基序。目前,两个程序 SPRy-SARUS 和 MOODS 可以在序列中搜索 di-PWM。结果 我们提出了一个 Python 包 dipwmsearch,它为这项任务提供了一种原创且高效的算法(它首先枚举 di-PWM 的匹配词,然后立即在序列中搜索它们,即使它包含 IUPAC 代码)。用户可以通过 Pypi 或 conda 轻松安装,使用文档化的 Python 界面和可重复使用的示例脚本,从而顺利使用 di-PWM。可用性和实施:dipwmsearch 可在 https://pypi.org/project/dipwmsearch/ 和 https://gite.lirmm.fr/rivals/dipwmsearch/ 下根据 Cecill 许可获得。
顺式调节元件(CRE),例如启动子和增强子,是调节基因表达的DNA序列。CRE的活性受到序列基序的顺序,组成和间距的影响,这些序列基序被称为转录因子(TFS)结合的序列基序。合成CRE具有特定特性。在这里,我们提出了Reglm,这是一个设计具有所需属性的合成CRE的框架,例如高,低或细胞类型 - 特定活动,并使用自回归语言模型与有监督的序列到功能模型结合。我们使用框架设计合成酵母启动子和细胞类型 - 特定的人类增强剂。我们证明,我们方法产生的合成CRE不仅被预测具有所需的功能,而且还包含类似于实验验证的CRE的生物学特征。reglm因此促进了现实的调节DNA元素的设计,同时提供了对顺式调节代码的见解。
类似的小分子CGMP是GC活性的产物,是动物中的另一个关键第二信使(16)。通过审查的序列分析,我们发现了一个相对保守的GC基序(17),与先前表征的AC基序(15)相邻,在TIR1/AFB的C末端区域(图1a)。为了测试TIR1/AFB生长素受体的潜在GC活性,我们使用了从SF9昆虫细胞中纯化的HIS-GFP-FLAG-TIR1,GST-AFB1以及GST-AFB5蛋白纯化了30
1型糖尿病(T1D)是一种T细胞介导的疾病,具有强大的免疫遗传HLA依赖性。HLA等位基因对T细胞受体(TCR)曲目的影响塑造胸腺的选择并控制糖尿病生成克隆的激活,但在T1D中仍未解决。我们对三个横截面同类群(包括T1D患者)以及健康相关和无关的对照组的2250个HLA类型的个体进行了循环的TCRβ链曲目。我们发现HLA风险等位基因在T1D个体中显示出更高的TCR曲目限制。我们利用深度学习来鉴定与T1D相关的TCR子序列基序,这些基序在居住在T1D个体的胰腺淋巴淋巴结中的独立TCR同类中也观察到。总体而言,我们的数据证明了基于遗传风险的T1D相关的TCR基序富集,为自动反应性提供了潜在的指标,以及基于TCR的诊断和治疗剂的基础。
。CC-BY-NC-ND 4.0 国际许可,根据 提供(未经同行评审认证)是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是此预印本的版权持有者此版本于 2023 年 3 月 29 日发布。;https://doi.org/10.1101/2023.03.28.534604 doi:bioRxiv 预印本
(RxLR) 基序,这是易位所必需的 [2,5]。RxLR 效应物递送到宿主细胞中的方式存在争议;关于 RxLR 基序与宿主质膜脂质结合和细胞自主摄取的说法受到了质疑 [4]。有证据表明 RxLR 基序是蛋白水解加工的位点,在分泌过程中被切割和去除 [5]。与卵菌效应物相比,真菌细胞质效应物缺乏与易位相关的明显氨基酸基序。然而,卵菌和真菌效应物中保守的结构折叠被认为有助于效应物递送 [4]。有趣的是,真菌病原体稻瘟病菌 [ 6 ] 和卵菌晚疫病菌 [ 7 ] 的细胞质效应物都是通过非常规蛋白分泌 (UPS) 途径从这些病原体中输出的,也就是说,尽管它们具有分泌信号肽,但它们的输出对抑制剂布雷菲德菌素 A 不敏感,因为抑制剂布雷菲德菌素 A 会阻断细胞内囊泡运动,从而阻止通过内质网 (ER) 和高尔基体的常规分泌。分泌途径可能是决定这些病原体向宿主输送的关键步骤。事实上,有证据表明,通过 UPS 途径从丝状病原体中输出细胞质效应物的情况非常普遍 [ 4 ]。除了了解细胞质效应物的分泌之外,一个关键问题是:它们如何进入植物细胞?
PAT 逆转录转座因子与其他逆转录因子的不同之处在于它们具有“分裂直接重复”结构,即发现内部 300bp 序列重复,每个因子末端约有一半重复。在带有 Northern 印迹的 Panagrellus redivivus 总 RNA 上检测到约 900nt 的非常丰富的转录本,其起始部分映射到 PAT 因子的优先删除部分。潜在对应的 ORF 编码具有羧基末端半胱氨酸基序的 265 个残基的蛋白质,据信这是逆转录因子中 GAG 蛋白的唯一特征。在 Northern 印迹上还检测到一个更暗淡的 1800nt 长的转录本,它位于第一个 ORF 的稍下游。该区域的预测蛋白质序列带有逆转录酶和 RNaseH 的典型基序,如在逆转录因子的 Pol 基因中发现的。肽基序与来自盘基网柄菌的DIRS-1元件最为相似。讨论了使用PAT元件作为秀丽隐杆线虫转座子标记系统的可能性。