胆管癌 (CCA) 是一种罕见的腺癌,起源于胆管上皮细胞,常表现为局部晚期或转移性病变,预后极差 [1]。根据病理结构的位置,可分为三型:肝内胆管癌 (iCCA)、肝门部胆管癌 (pCCA) 和远端胆管癌 (dCCA) [2]。目前胆管癌的首选治疗方法是手术切除,但该方法仅适用于早期。对于不适合手术的中晚期患者,一般选择局部区域治疗、化放疗和靶向药物治疗 [3]。但即使采用综合治疗,治疗效果也不令人满意。3 期和 4 期胆管癌的 5 年总生存率分别为 10% 和 0% [4]。此外,由于发病率上升,胆管癌死亡人数累计增加了39%,男性死亡率(1.9/100 000)高于女性死亡率(1.5/100 000)[5]。近年来,生物信息学和微阵列方法在复杂疾病的多基因或蛋白质探索和分析中变得越来越有效[6]。通过应用相应的生物信息学算法,这些方法可以识别疾病的核心驱动基因和异常调控通路,有助于研究人员系统、准确、有效地揭示治疗的分子靶点,为肿瘤的发生发展提供理论依据。分子对接是一种成熟的基于计算机结构的方法,广泛应用于药物研发[7]。虚拟筛选是一种具有多种可用工具的计算技术[8],通过分子对接可以从数百万个分子中筛选出具有药物特性的活性化合物。因此,虚拟筛选和分子对接是合理药物设计和药物化学中广泛实用的方法[9,10]。例如,针对胆管癌中潜在的驱动基因畸变,已经开发了几种治疗晚期疾病的新药,包括FGFR抑制剂和IDH抑制剂[11]。在本研究中,我们利用生物信息学和虚拟筛选方法相结合,筛选出可以结合特定靶点的药物,以促进胆管癌药物的研究和开发。此外,该方法已被证明是有效的,并有助于治疗其他疾病,如骨肉瘤和胶质母细胞瘤[12,13]。本研究从基因表达综合数据库中下载了3个涉及CCA的mRNA微阵列数据集(GSE132305、GSE89749和GSE45001),并通过比较CCA和正常组织的基因表达谱来分析这些数据集以识别差异表达基因(DEG)。然后,使用Venn分析筛选出相互的DEG。通过基因本体论(GO)和京都基因与基因组百科全书(KEGG)富集分析,研究CCA的生物学功能和信号通路改变。进行PPI网络构建,识别枢纽基因。接下来,利用虚拟筛选、分子对接等一系列结构生物学方法,筛选和识别对MYC有潜在抑制作用的先导化合物。此外,我们的研究还预测了CCA在体内的吸收、分布、代谢和功能。
动机:溶剂可访问的表面是与蛋白质结构和蛋白质功能相关的必不可少的结构特性度量。相对溶剂可访问区域(RSA)是描述蛋白质表面或蛋白质内部暴露程度的标准措施。但是,当残基信息缺失时,此计算将失败。结果:在本文中,我们提出了一种新型的E刺激方法,并使用了D E EP LEAN方法(Eagerer)。新方法,急切的,在两个独立的测试数据集上达到了Pearson相关系数为0.921–0.928。我们从经验上证明,与现有的RSA估计量相比,急切的人可以产生更好的皮尔森相关系数,例如协调数,半球体暴露和spherecon。据我们所知,狂热者代表了使用有限的信息和深度学习模型的有限信息来估算溶剂可访问区域的第一种方法。它可能对蛋白质结构和蛋白质功能预测有用。可用性和实现:该方法可以在https://github.com/cliffgao/eagerer上免费获得。联系人:gaojz@nankai.edu.cn补充信息:补充数据可在BioInformatics Online获得。
+ * - *,% + + + + + + + + 3 - * ,,, ,, ,, ,, ,,, ,, ,,,,,,,,,> + + + + + + + + + + + + + + + * 0-0-0.20?%。%。%。%。 div>''7 + * *& + +,0.0?%。 div>''0 - * + + 0?%。 div>''7 @ + - * - + + 7 - *, - + + + + + + 7 + 0.0?%%%%%%%%%; div>'' - + + * +,4- + 0.0?%。 div>'' + - +和(7,> + * 3%5, - *, - + + + - 7 + * - _ +!”,4 - * 0(; *&7 3&5,> - +&,% * - 7 +,? +#$% + + + +&, - * 2,4&2 * +& * 0(;,> + ** + - , * - * - *& + + + + + + + + +, +, + - * / + - + - + - + - , - + - +, +,< / div>,< / div>,< / div>,< / div>,< / div>,< / div>,< / div>,< / div>
摘要 IgA 肾病 (IgAN) 是最常见的肾小球肾炎。其特征是含有免疫球蛋白 A (IgA) 的免疫复合物沉积在肾脏的肾小球中,从而引发炎症过程。在许多患者中,该病呈进行性发展,最终导致终末期肾病。目前对 IgAN 病理生理学的理解并不完整,涉及多个潜在参与者,包括粘膜免疫系统、补体系统和微生物组。解剖这种复杂的病理生理学需要跨分子、细胞和器官尺度的综合分析。可以通过采用新兴技术获得此类数据,包括单细胞测序、下一代测序、蛋白质组学和复杂成像方法。这些技术会生成复杂的“大数据”,需要先进的计算方法进行分析和解释。本文介绍了此类方法,重点关注生物信息学和人工智能的广泛领域,并讨论了它们如何促进我们对 IgAN 的理解并最终改善患者护理。先进的实验和计算技术与医学和临床专业知识的紧密结合对于提高我们对人类疾病的理解至关重要。我们认为 IgAN 是一种典型的疾病,可以证明这种多学科方法的价值。
受环境因素和肠道微生物群的变化影响,CD o cd o gen会导致先天和适应性免疫反应的疾病,范围从轻度活性疾病(如偶尔的直肠腹泻)和严重活跃的疾病到可能导致10 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 20 - 每天流血弓箭的平移。此外,患有CD的人患有癌症,骨质疏松症,贫血,营养症,抑郁症,感染和血栓形成的风险增加。3然而,cd和uc之间的位置不同。在CD中,在弹药中通常是透壁,CD可能与肠肉芽肿,狭窄和stulas有关,而在UC中,cd通常仅限于粘膜,并且CD中的症状在UC中并不典型。4此外,IBD,包括两种特发性CD和UC的类型,以及非典型类型的胶原蛋白结肠炎和难治性结肠炎,被特征在于慢性胃肠道症中的慢性胃肠道,交替的临床缓解复发,并且需要通过结肠直肠切除来治疗患有严重IBD的患者。5 IBD在美国有超过100万个人,而欧洲超过250万。IBD的患病率在西方世界中最高,影响多达0.5%的总人口,治疗成本超过60亿。6主要有5-氨基水杨酸,6-
个人信息。这有助于确保匿名和隐私,减少罪犯和政府机构的监视机会。加密技术是如此强大,以至于一些政府试图限制加密的有效性,这不能确保公司或个人的隐私。➢加密是合规性的一部分,许多行业具有严格的合规性
未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此预印本的版权所有者(此版本于 2020 年 4 月 8 日发布。;https://doi.org/10.1101/2020.04.06.027805 doi:bioRxiv preprint
摘要众所周知,无数的药物和物质会诱导与血压(BP)调节有关的副作用。本研究旨在研究为什么某些药物倾向于引起医源性高血压(HTN),并专注于与这些疾病有关的药物靶标。数据库和资源,例如SIDE,药物库和Genomatix,以生物信息研究HTN相关的药物基因,HTN是副作用。创建了类似树状的图,代表了与血压系统有关的198个人类基因之间的相互作用。72 HTN指出,研究了药物和160种HTN诱导药物。 鉴定了受这些药物影响的 HTN相关基因。 htn表明,针对相互作用树几乎所有分支的药物都显示出对BP调节系统的大多数功能子系统产生影响。并专门用于肾上腺素能和多巴胺能受体途径。 在指示和HTN诱导药物类别之间共享靶标的高患病率(25个基因)。 我们专注于六个未针对HTN治疗的药物家庭,但据报道是血压副作用的主要原因。 我们显示了可能导致这种医源作用的分子机制。 这样的分析可能具有临床意义,可以允许开发量身定制的药物具有更少的副作用。72 HTN指出,研究了药物和160种HTN诱导药物。鉴定了受这些药物影响的 HTN相关基因。 htn表明,针对相互作用树几乎所有分支的药物都显示出对BP调节系统的大多数功能子系统产生影响。并专门用于肾上腺素能和多巴胺能受体途径。 在指示和HTN诱导药物类别之间共享靶标的高患病率(25个基因)。 我们专注于六个未针对HTN治疗的药物家庭,但据报道是血压副作用的主要原因。 我们显示了可能导致这种医源作用的分子机制。 这样的分析可能具有临床意义,可以允许开发量身定制的药物具有更少的副作用。HTN相关基因。htn表明,针对相互作用树几乎所有分支的药物都显示出对BP调节系统的大多数功能子系统产生影响。并专门用于肾上腺素能和多巴胺能受体途径。在指示和HTN诱导药物类别之间共享靶标的高患病率(25个基因)。 我们专注于六个未针对HTN治疗的药物家庭,但据报道是血压副作用的主要原因。 我们显示了可能导致这种医源作用的分子机制。 这样的分析可能具有临床意义,可以允许开发量身定制的药物具有更少的副作用。在指示和HTN诱导药物类别之间共享靶标的高患病率(25个基因)。我们专注于六个未针对HTN治疗的药物家庭,但据报道是血压副作用的主要原因。我们显示了可能导致这种医源作用的分子机制。这样的分析可能具有临床意义,可以允许开发量身定制的药物具有更少的副作用。
1个生物信息学和结构蛋白质组学,国家癌症研究所。Genova动机工作流程系统是协调对标准化Web服务数据并检索数据的有效选择。已经开发了用于生物信息学的各种工作流管理系统(WMS)。然而,创建工作流程可能很困难,因为它暗示了可用的Web服务和数据格式的知识,而不是提及编程技能。工作流颁布门户。Biowep是生物信息学的工作流颁布门户,已在线向所有研究人员提供[1,2]。它允许进行预定义的工作流以及工作流执行和相关结果的存储和检索。它通过生物信息学任务的本体来支持工作流程的注释。搜索和选择工作流程可以根据其注释进行。BiOwep使用开源:WMS Taverna [3]和MySQL。在这里,我们提出了BiOWEPS WorkFlow存储库管理器(WFRM),这是一个Web应用程序,用于管理工作流存储库中的工作流程。wfrm支持用XSCUFL描述的半自动,有效的插入,更新和注释,这是Mygrid倡议中开发的工作流语言[4,5]。方法WFRM已被实施为BioWep管理的前端。它是通过使用Javaserver页面(JSP)技术编写的,该技术提供了一种快速,简化,与服务器和平台无关的方式来创建动态Web内容。现在,系统维护是简单而直观的。WFRM提供了一个以用户为中心的接口,用于上传用XSCUFL语言编写的工作流程。它包括一个基于MySQL数据库的Java类后端组件,该组件将接口与工作流存储库连接起来。上传的工作流程首先存储在工作目录中,然后通过使用一组基于SAX的类进行句法验证并最终解析。这些返回工作流对客户端应用程序的值,因此在数据库中促进了以应用程序驱动的基本数据的插入,例如工作流量名称,描述和作者。其他信息,例如Workflows应用程序域,必须由用户添加。在我们的DB模式中,我们称之为版本的工作流程及其实现之间有区别。工作流程仅在其目标的基础上在概念上描述,并且没有指任何实际文件。而是将每个版本严格链接到一个文件,可以制定并给出结果。版本可能会有所不同,例如,对于访问的Web服务,提供替代方案,但同等,服务和本地详细处理程序,可以通过保持相同的功能来修改它们。因此,WFRM在上传新工作流程之间有一个区别,在这种情况下,关联的文件将分配给工作流的第一个版本,或者是现有工作流的新版本。提交的文件包括处理器的描述,其链接以及工作流的整体输入和输出。通过生物信息学数据和任务的分类,WFRM在半自动上有效地注释了此信息。我们选择注释总体工作流程和最重要的处理器(将其选择留给用户)。然后将注释插入数据库中,而工作流程本身不会更改。java applet为研究人员提供了探索性工具,用于识别和选择注释应用程序域,详细说明任务以及输入和输出数据类型的最佳定义。可以随时更新(插入,修改或删除)注释。我们对生物信息学任务和数据的分类来自原始的Mygrid本体[6],这些本体已通过使用不同的层次结构进行了重组,并通过添加生物资源和图像数据类型来扩展。在搜索存储库中的工作流程时也使用此注释。结果,我们介绍了WFRM,这是一种用户友好的接口,该界面是用于在BiOWEP WorkFlow存储库中高效且半自动管理信息的工具。之前,在存储库中插入工作流程是一个复杂且耗时的过程,需要手动更新数据库内容。工作流程基本数据已收集,处理器由适当的本体学注释,并且数据库以连贯和有效的方式更新。
通讯作者。Pedro Larran〜Aga,智能系统集团,计算机科学与人工智能系,巴斯克大学,Paseo Manuel de Lardizabal,1,20018 San Sebastian,西班牙。电话:Þ34943018045;传真:34934015590;电子邮件:pedro.larranaga@ehu.es pedro larran×Aga是巴斯克大学大学计算机科学和人工智能教授。他于1981年获得了Valladolid大学的数学学士学位,并于1995年获得了巴斯克大学的计算机科学博士学位。他发表了40多个被指控的期刊论文。他的主要研究兴趣在于进化计算,机器学习,概率图形模型和生物信息学领域。Borja Calvo于1999年获得生物化学硕士学位和2004年的计算机科学学士学位,均来自巴斯克大学的大学。目前,他是巴斯克大学大学的博士生,也是智能系统小组的成员。他的研究兴趣包括应用于生物信息学的机器学习方法。罗伯托·桑塔纳(Roberto Santana)于2005年获得哈瓦那大学的数学博士学位。目前,他是巴斯克大学的智能系统小组成员。他的研究兴趣包括分布算法和生物信息学的估计。Concha Bielza于1989年获得了Madrid的Compressense University,Madrid和Phd的计算机科学博士学位,于1996年获得了马德里马德里技术大学的计算机科学学位。她是马德里技术大学计算机科学学院的统计与操作研究副教授。她的研究兴趣主要在概率图形模型,决策分析,用于优化的元启发式,数据挖掘,分类模型和实际应用领域。她的研究出现在管理科学,计算机和运营研究,统计和计算,海军研究物流,运营研究学会杂志等期刊上。Josu Galdiano目前正在巴斯克大学的计算机科学硕士学位。他的研究兴趣包括应用于生物信息学的机器学习方法。在Aki Inza中是巴斯克大学智能系统小组的讲师。他的研究兴趣包括数据挖掘和搜索启发式方法,特别关注概率图形模型和生物信息学应用程序。JoseäA.Lozano分别于1991年,1992年和1998年获得了西班牙巴斯克大学的数学和计算机科学学士学位以及博士学位。自1999年以来,他一直是巴斯克大学大学计算机科学副教授。他已经编辑了三本书,并发表了25份被指控的期刊论文。他的主要研究兴趣是进化计算,机器学习,概率图形模型和生物信息学。rubeãn arman ‹anzas于2004年从巴斯克大学的计算机科学获得了计算机科学硕士学位。目前,他是博士生,也是智能系统小组的成员。他的研究兴趣包括特征选择,计算生物学和生物信息学。guzmaäNsantafeä2002年从巴斯克大学获得了计算机科学硕士学位。目前,他是巴斯克大学大学的博士生,也是智能系统小组的成员。他的研究兴趣包括应用于生物信息学的机器学习技术。aritzpeäRez从巴斯克大学获得了计算机科学学位。他目前正在计算机科学和人工智能系获得计算机科学博士学位。他的研究兴趣包括机器学习,数据挖掘和生物信息学。目前,他正在使用贝叶斯网络,可变选择和密度估计的监督分类,重点是连续域。Victor Robles分别于1998年和2003年获得了MADRID大学的计算机工程和博士学位。在2004年,他是哈佛医学院的博士后研究员。他目前是马德里大学计算机系统建筑和技术系的副教授。他的研究兴趣包括生物信息学,数据挖掘和优化。Robles博士一直参与了几个研讨会和出版物的组织,以及有关程序的几本书。