单元 1:计算思维和编程 – 2 ● 复习 11 年级中涵盖的 Python 主题。 ● 函数:函数类型(内置函数、模块中定义的函数、用户定义函数)、创建用户定义函数、参数和形参、默认参数、位置参数、函数返回值、执行流程、变量的作用域(全局作用域、局部作用域) ● 异常处理:简介、使用 try-except-finally 块处理异常 ● 文件简介、文件类型(文本文件、二进制文件、CSV 文件)、相对路径和绝对路径 ● 文本文件:打开文本文件、文本文件打开模式(r、r+、w、w+、a、a+)、关闭文本文件、使用 with 子句打开文件、使用 write() 和 writelines() 将数据写入/附加到文本文件、使用 read()、readline() 和 readlines() 从文本文件读取、seek 和 tell 方法、文本文件中的数据操作 ● 二进制文件:二进制文件的基本操作:使用文件打开模式(rb、rb+、wb、wb+、ab、ab+)打开、关闭二进制文件、导入 pickle 模块、dump()和 load() 方法,在二进制文件中读取、写入/创建、搜索、附加和更新操作 ● CSV 文件:导入 csv 模块,打开/关闭 csv 文件,使用 writer()、writerow()、writerows() 写入 csv 文件并使用 reader() 从 csv 文件中读取 ● 数据结构:堆栈、堆栈上的操作(推送和弹出)、使用列表实现堆栈。
单元 1:计算思维和编程 – 2 ● 复习 11 年级中涵盖的 Python 主题。 ● 函数:函数类型(内置函数、模块中定义的函数、用户定义函数)、创建用户定义函数、参数和形参、默认参数、位置参数、函数返回值、执行流程、变量的作用域(全局作用域、局部作用域) ● 异常处理:简介、使用 try-except-finally 块处理异常 ● 文件简介、文件类型(文本文件、二进制文件、CSV 文件)、相对路径和绝对路径 ● 文本文件:打开文本文件、文本文件打开模式(r、r+、w、w+、a、a+)、关闭文本文件、使用 with 子句打开文件、使用 write() 和 writelines() 将数据写入/附加到文本文件、使用 read()、readline() 和 readlines() 从文本文件读取、seek 和 tell 方法、文本文件中的数据操作 ● 二进制文件:二进制文件的基本操作:使用文件打开模式(rb、rb+、wb、wb+、ab、ab+)打开、关闭二进制文件、导入 pickle 模块、dump()和 load() 方法,在二进制文件中读取、写入/创建、搜索、附加和更新操作 ● CSV 文件:导入 csv 模块,打开/关闭 csv 文件,使用 writer()、writerow()、writerows() 写入 csv 文件并使用 reader() 从 csv 文件中读取 ● 数据结构:堆栈、堆栈上的操作(推送和弹出)、使用列表实现堆栈。
(未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此预印本的版权所有者此版本于 2021 年 5 月 1 日发布。;https://doi.org/10.1101/2021.05.01.442224 doi:bioRxiv preprint
图1 E3泛素连接酶和SCF型E3连接酶复合物的结构域结构:A,常见的结构是E3泛素连接酶复合酶配合物,介导许多细胞蛋白的靶向降解。In targeting substrate proteins for degradation, ubiquitin is passed from an E1 ubiquitin-activating enzyme to an E2 ubiquitin-conjugating enzyme to the protein substrate, with the final step (ligating ubiquitin to the substrate) catalyzed by an E3 ubiquitin ligase.b,已知SCF复合物是E3连接酶,而SCF型E3连接酶中的每个复合酶都与一组衔接蛋白相互作用,这些衔接蛋白通过特定的蛋白质 - 蛋白质相互作用域募集不同的结合伴侣,例如WD40 repots,例如重复(LRR)(LRR)(LRR),并在protitate sisstrate for Protiate Degradation degradation。这个数字是由作者(N.K.J.)创建的使用网站https://app.biorender.com [校正于2021年4月27日,在第一次在线出版物之后:图2中的一个错字]
最近关于预测药物分子和蛋白质之间结合亲和力的研究使用了通过无监督学习技术从大型分子 SMILES 和蛋白质序列数据库中学习到的表示。虽然这些表示显著提高了预测能力,但它们通常基于一组有限的模态,并且没有利用有关分子和蛋白质之间现有关系的可用知识。我们的研究表明,从描述分子和蛋白质之间关系的多模态知识图谱中获得的增强表示可以在成熟的基准测试中产生最先进的结果(在 Therapeutics Data Commons 基准测试“药物-靶标相互作用域泛化基准”排行榜上名列第一,比之前的最佳结果提高了 8 分)。此外,我们的结果远远超过了使用仅依赖序列或 SMILES 数据的传统预训练表示在标准基准测试中取得的结果。我们发布了多模态知识图谱,整合了来自七个公共数据源的数据,其中包含超过 3000 万个三元组。我们还发布了根据我们提出的图表和基准任务源代码进行预训练的模型。
妇科癌症的治疗历来都是根据其推测的起源部位,而不考虑其潜在的组织学 [1]。众所周知,初始表现、自然病史和治疗反应会因组织学亚型的不同而有很大差异 [2]。对这些癌症进行严格的病理学研究和公正的基因组分析,正在阐明这些不同恶性肿瘤的潜在生物学。妇科透明细胞癌 (CCC) 就是这样一种罕见的组织学亚型。与其他更常见的亚型相比,透明细胞组织学与化疗难治性和较差的生存率有关 [3, 4]。从流行病学角度来看,CCC 与子宫内膜异位症病史有关,无论其起源部位如何,都表现出相似的肿瘤基因组图谱 [5–7]。 CCC 以及子宫内膜异位症相关子宫内膜样癌的基因组研究发现,肿瘤抑制基因 AT 富集相互作用域蛋白 1A (ARID1A) 的体细胞突变发生率很高 [6]。ARID1A 基因编码 BAF250a (ARID1A),该蛋白形成几种不同的 ATP 依赖性染色质重塑 SWItch/蔗糖不可发酵 (SWI/SNF) 蛋白复合物的亚基 [8]。SWI/SNF 复合物是一种表观遗传调节剂,在细胞凋亡过程中起着重要作用。
AD 是基因组折叠的一个基本特征,2012 年在首批全基因组染色质折叠图谱 1 – 4 中共同发现。TAD 最初在低分辨率(40 kb)哺乳动物 Hi-C 矩阵中通过算法定义为兆碱基规模的基因组块,其中 DNA 序列与域内其他 DNA 序列的相互作用频率明显高于与域外的相互作用频率(图 1a)。TAD 最显著的特征可能是它们有边界可划定(图 1a、b)。为解释这些开创性的经验观察结果,提出了一个令人信服的假设,即大多数哺乳动物基因组折叠成相邻的球状染色质相互作用域,由线性边界 1 – 4 连接(图 1b)。另一项进展是观察到较小的亚兆碱基级染色质结构域(即所谓的亚TAD)在哺乳动物 Hi-C 图谱 5、6 中以层次结构嵌套在 TAD 内(图 1c、d)。在原始低分辨率 Hi-C 数据中仅观察到一小部分嵌套的亚TAD,但在技术进步促进了超高分辨率(1-4 kb)架构图的创建后,它们可以很容易地在整个基因组范围内检测到。嵌套的亚TAD 类似于 TAD 的结构域,也由边界划分。然而,亚TAD 边界表现出较弱的绝缘强度,这表现为它们相对较低地减弱结构域间长距离接触的能力,并且它们比 TAD 更有可能表现出细胞类型动态折叠特性 1、5、7。我们和其他人假设较弱的细胞类型动态亚 TAD 边界具有与 TAD 边界不同的结构、分子或功能特性,但这种可能性仍是一个悬而未决的问题。术语“接触域”也用于 Hi-C 文献中,通常用作传达全套自缔合染色质域(TAD、嵌套亚 TAD 和隔室域(如下所述))的总称。此外,“微型域”或“微型 TAD”最近已用于描述哺乳动物 8、9 和苍蝇 10 中包含单个基因单元的最小规模染色质块。因此,随着技术进步使高分辨率 Hi-C 矩阵成为可能,染色质域的算法识别揭示了越来越小和更精细的结构。此外,一系列功能性遗传扰动实验
虚拟筛选等预测方法已用于药物研发,目的是减少开发时间和成本。当前的机器学习和基于网络的方法存在与泛化、可用性或模型可解释性相关的问题,特别是由于目标蛋白的结构/功能的复杂性以及系统训练数据集的偏差。在这里,我们提出了一种新方法“DRUIDom”(DRUg 相互作用域预测),利用蛋白质的结构域模块化来识别药物候选化合物和靶标之间的生物相互作用,以克服与当前方法相关的问题。DRUIDom 由两个方法步骤组成。首先,将配体/化合物统计地映射到其靶蛋白的结构域,目的是识别它们的相互作用。这样,包含相同映射域或域对的其他蛋白质就成为相应化合物的新候选靶标。接下来,根据分子相似性对百万级小分子化合物数据集(包括上一步中映射到域的化合物)进行聚类,并将它们的域关联传播到同一聚类内的其他化合物。从公共数据库获得的经过实验验证的生物活性数据点经过精心筛选,构建活性/相互作用和非活性/非相互作用药物/化合物-靶标对的数据集(约 290 万个数据点),并用作计算化合物-域映射参数的训练数据,从而得到 250 个域和 8,165 种化合物之间的 27,032 个高置信度关联,最终输出约 500 万个新的化合物-蛋白质相互作用。通过对预测靶向 LIM-激酶蛋白的化合物进行合成和生物活性分析,对 DRUIdom 进行了实验验证,LIM-激酶蛋白在通过肌动蛋白丝动力学调节细胞运动、细胞周期进程和分化方面发挥关键作用。我们发现 LIMK-inhibitor-2 及其衍生物通过抑制 LIMK 磷酸化和下游蛋白肌动蛋白丝切蛋白,显著阻止癌细胞迁移。
虚拟筛选等预测方法已用于药物研发,目的是减少开发时间和成本。当前的机器学习和基于网络的方法存在与泛化、可用性或模型可解释性相关的问题,特别是由于目标蛋白的结构/功能的复杂性以及系统训练数据集的偏差。在这里,我们提出了一种新方法“DRUIDom”(DRUg 相互作用域预测),利用蛋白质的结构域模块化来识别药物候选化合物和靶标之间的生物相互作用,以克服与当前方法相关的问题。DRUIDom 由两个方法步骤组成。首先,将配体/化合物统计地映射到其靶蛋白的结构域,目的是识别它们的相互作用。这样,包含相同映射域或域对的其他蛋白质就成为相应化合物的新候选靶标。接下来,根据分子相似性对百万级小分子化合物数据集(包括上一步中映射到域的化合物)进行聚类,并将它们的域关联传播到同一聚类内的其他化合物。从公共数据库获得的经过实验验证的生物活性数据点经过精心筛选,构建活性/相互作用和非活性/非相互作用药物/化合物-靶标对的数据集(约 290 万个数据点),并用作计算化合物-域映射参数的训练数据,从而得到 250 个域和 8,165 种化合物之间的 27,032 个高置信度关联,最终输出约 500 万个新的化合物-蛋白质相互作用。通过对预测靶向 LIM-激酶蛋白的化合物进行合成和生物活性分析,对 DRUIdom 进行了实验验证,LIM-激酶蛋白在通过肌动蛋白丝动力学调节细胞运动、细胞周期进程和分化方面发挥关键作用。我们发现 LIMK-inhibitor-2 及其衍生物通过抑制 LIMK 磷酸化和下游蛋白肌动蛋白丝切蛋白,显著阻止癌细胞迁移。
间变性甲状腺癌 (ATC) 是最具侵袭性和恶性程度的实体肿瘤之一。泛素蛋白酶体系统存在于所有真核细胞中,对细胞稳态至关重要。但其在 ATC 中的潜在作用仍不清楚。TRIM11 是一种 E3 泛素连接酶,据报道在多种人类癌症中充当致癌基因。本研究旨在揭示 TRIM11 在 ATC 中的致癌功能。使用 Western blot 测量 TRIM11 和 YAP 的蛋白表达,而使用实时 PCR 测量 YAP 靶基因。CCK8 测定用于检测细胞活力;划痕愈合试验和 transwell 测定用于测量 ATC 的迁移能力。异种移植瘤模型用于体内研究。免疫沉淀试验用于检测 YAP 和 TRIM11 之间的相互作用域。并用基于泛素的免疫沉淀实验检测YAP发生的具体泛素化方式。TRIM11的缺失显著降低了ATC细胞的增殖和迁移能力,增加了细胞对化疗的敏感性,而YAP的过表达可以进一步挽救这种效应。TRIM11的缺失降低了ATC中YAP蛋白水平和YAP/TEAD靶基因,如CTGF、ANKRD1和CYR61。这表明TRIM11是Hippo信号通路的调控因子。免疫沉淀实验表明TRIM11的RING结构域对于与YAP的WW结构域的相互作用至关重要。进一步的机制分析表明TRIM11促进YAP的单泛素化,从而延长其蛋白半衰期。此外,TRIM11启动子分析表明SOX13通过与TRIM11启动子结合来激活TRIM11的转录。综上所述,本研究揭示了TRIM11在ATC中的致癌功能,TRIM11是Hippo通路的翻译后调控因子,靶向TRIM11可能是治疗ATC的一种潜在方法。