个人信息。这有助于确保匿名和隐私,减少罪犯和政府机构的监视机会。加密技术是如此强大,以至于一些政府试图限制加密的有效性,这不能确保公司或个人的隐私。➢加密是合规性的一部分,许多行业具有严格的合规性
未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此预印本的版权所有者(此版本于 2020 年 4 月 8 日发布。;https://doi.org/10.1101/2020.04.06.027805 doi:bioRxiv preprint
1个生物信息学和结构蛋白质组学,国家癌症研究所。Genova动机工作流程系统是协调对标准化Web服务数据并检索数据的有效选择。已经开发了用于生物信息学的各种工作流管理系统(WMS)。然而,创建工作流程可能很困难,因为它暗示了可用的Web服务和数据格式的知识,而不是提及编程技能。工作流颁布门户。Biowep是生物信息学的工作流颁布门户,已在线向所有研究人员提供[1,2]。它允许进行预定义的工作流以及工作流执行和相关结果的存储和检索。它通过生物信息学任务的本体来支持工作流程的注释。搜索和选择工作流程可以根据其注释进行。BiOwep使用开源:WMS Taverna [3]和MySQL。在这里,我们提出了BiOWEPS WorkFlow存储库管理器(WFRM),这是一个Web应用程序,用于管理工作流存储库中的工作流程。wfrm支持用XSCUFL描述的半自动,有效的插入,更新和注释,这是Mygrid倡议中开发的工作流语言[4,5]。方法WFRM已被实施为BioWep管理的前端。它是通过使用Javaserver页面(JSP)技术编写的,该技术提供了一种快速,简化,与服务器和平台无关的方式来创建动态Web内容。现在,系统维护是简单而直观的。WFRM提供了一个以用户为中心的接口,用于上传用XSCUFL语言编写的工作流程。它包括一个基于MySQL数据库的Java类后端组件,该组件将接口与工作流存储库连接起来。上传的工作流程首先存储在工作目录中,然后通过使用一组基于SAX的类进行句法验证并最终解析。这些返回工作流对客户端应用程序的值,因此在数据库中促进了以应用程序驱动的基本数据的插入,例如工作流量名称,描述和作者。其他信息,例如Workflows应用程序域,必须由用户添加。在我们的DB模式中,我们称之为版本的工作流程及其实现之间有区别。工作流程仅在其目标的基础上在概念上描述,并且没有指任何实际文件。而是将每个版本严格链接到一个文件,可以制定并给出结果。版本可能会有所不同,例如,对于访问的Web服务,提供替代方案,但同等,服务和本地详细处理程序,可以通过保持相同的功能来修改它们。因此,WFRM在上传新工作流程之间有一个区别,在这种情况下,关联的文件将分配给工作流的第一个版本,或者是现有工作流的新版本。提交的文件包括处理器的描述,其链接以及工作流的整体输入和输出。通过生物信息学数据和任务的分类,WFRM在半自动上有效地注释了此信息。我们选择注释总体工作流程和最重要的处理器(将其选择留给用户)。然后将注释插入数据库中,而工作流程本身不会更改。java applet为研究人员提供了探索性工具,用于识别和选择注释应用程序域,详细说明任务以及输入和输出数据类型的最佳定义。可以随时更新(插入,修改或删除)注释。我们对生物信息学任务和数据的分类来自原始的Mygrid本体[6],这些本体已通过使用不同的层次结构进行了重组,并通过添加生物资源和图像数据类型来扩展。在搜索存储库中的工作流程时也使用此注释。结果,我们介绍了WFRM,这是一种用户友好的接口,该界面是用于在BiOWEP WorkFlow存储库中高效且半自动管理信息的工具。之前,在存储库中插入工作流程是一个复杂且耗时的过程,需要手动更新数据库内容。工作流程基本数据已收集,处理器由适当的本体学注释,并且数据库以连贯和有效的方式更新。
通讯作者。Pedro Larran〜Aga,智能系统集团,计算机科学与人工智能系,巴斯克大学,Paseo Manuel de Lardizabal,1,20018 San Sebastian,西班牙。电话:Þ34943018045;传真:34934015590;电子邮件:pedro.larranaga@ehu.es pedro larran×Aga是巴斯克大学大学计算机科学和人工智能教授。他于1981年获得了Valladolid大学的数学学士学位,并于1995年获得了巴斯克大学的计算机科学博士学位。他发表了40多个被指控的期刊论文。他的主要研究兴趣在于进化计算,机器学习,概率图形模型和生物信息学领域。Borja Calvo于1999年获得生物化学硕士学位和2004年的计算机科学学士学位,均来自巴斯克大学的大学。目前,他是巴斯克大学大学的博士生,也是智能系统小组的成员。他的研究兴趣包括应用于生物信息学的机器学习方法。罗伯托·桑塔纳(Roberto Santana)于2005年获得哈瓦那大学的数学博士学位。目前,他是巴斯克大学的智能系统小组成员。他的研究兴趣包括分布算法和生物信息学的估计。Concha Bielza于1989年获得了Madrid的Compressense University,Madrid和Phd的计算机科学博士学位,于1996年获得了马德里马德里技术大学的计算机科学学位。她是马德里技术大学计算机科学学院的统计与操作研究副教授。她的研究兴趣主要在概率图形模型,决策分析,用于优化的元启发式,数据挖掘,分类模型和实际应用领域。她的研究出现在管理科学,计算机和运营研究,统计和计算,海军研究物流,运营研究学会杂志等期刊上。Josu Galdiano目前正在巴斯克大学的计算机科学硕士学位。他的研究兴趣包括应用于生物信息学的机器学习方法。在Aki Inza中是巴斯克大学智能系统小组的讲师。他的研究兴趣包括数据挖掘和搜索启发式方法,特别关注概率图形模型和生物信息学应用程序。JoseäA.Lozano分别于1991年,1992年和1998年获得了西班牙巴斯克大学的数学和计算机科学学士学位以及博士学位。自1999年以来,他一直是巴斯克大学大学计算机科学副教授。他已经编辑了三本书,并发表了25份被指控的期刊论文。他的主要研究兴趣是进化计算,机器学习,概率图形模型和生物信息学。rubeãn arman ‹anzas于2004年从巴斯克大学的计算机科学获得了计算机科学硕士学位。目前,他是博士生,也是智能系统小组的成员。他的研究兴趣包括特征选择,计算生物学和生物信息学。guzmaäNsantafeä2002年从巴斯克大学获得了计算机科学硕士学位。目前,他是巴斯克大学大学的博士生,也是智能系统小组的成员。他的研究兴趣包括应用于生物信息学的机器学习技术。aritzpeäRez从巴斯克大学获得了计算机科学学位。他目前正在计算机科学和人工智能系获得计算机科学博士学位。他的研究兴趣包括机器学习,数据挖掘和生物信息学。目前,他正在使用贝叶斯网络,可变选择和密度估计的监督分类,重点是连续域。Victor Robles分别于1998年和2003年获得了MADRID大学的计算机工程和博士学位。在2004年,他是哈佛医学院的博士后研究员。他目前是马德里大学计算机系统建筑和技术系的副教授。他的研究兴趣包括生物信息学,数据挖掘和优化。Robles博士一直参与了几个研讨会和出版物的组织,以及有关程序的几本书。
人工智能 (AI) 在生物信息学研究和计算分子生物学中越来越受到关注。随着不同类型的 AI 算法的出现,研究人员使用现成的系统对数据库进行分类和挖掘已变得很普遍。目前,文献中提供了各种智能方法,研究人员在选择可应用于特定数据集的最佳方法时面临困难。研究人员需要能够以易于理解的方式呈现数据的工具,并附上上下文注释、准确度估计和解释。本文旨在回顾 AI 在生物信息学和计算分子生物学 (DNA 测序) 领域的应用。这些领域的兴起源于生物学家利用和帮助解释基因组研究中不断收集的大量数据的需求。许多生物信息学和 DNA 测序方法的根本动机是生物体的进化和处理错误数据的复杂性。本文还介绍了研究界开发的用于以下目的的软件程序:(1)搜索、分类和挖掘不同的可用生物数据库;(2)模拟有误和无误的生物实验。q 2005 Elsevier Ltd. 保留所有权利。