Biowulf 是美国国立卫生研究院 (NIH) 首屈一指的高性能计算 (HPC) 系统,今年已满 25 岁。与你可能在 1990 年代投资的那台戴尔 486(32 MB RAM;是的,这应该足够了)不同,Biowulf 速度更快,容量比以往任何时候都大。事实上,Biowulf 是美国最强大的专用于生物医学研究的 HPC 系统。负责维护 Biowulf 的 NIH 信息技术中心 (CIT) 希望进一步增强其能力,以适应快速发展的人工智能 (AI) 和机器学习 (ML) 需求,CIT 高性能计算核心设施主任 Steve Bailey 表示。Bailey 表示,如今,Biowulf 为近 2,500 名活跃用户提供服务,其中包括 NIH IRP 中近四分之三的首席研究员。大部分用途是基因组学,其次是结构生物学和成像。 NHGRI 基因组学和数据科学研究中心高级研究员兼主任 Adam Phillippy 就是这样的 Biowulf 用户。他的实验室每年使用超过 3000 万个中央处理器 (CPU) 小时。借助 Biowulf,Phillippy 和他的同事能够在 2022 年完全完成人类基因组序列,纠正在 1990-2003 年左右的初始映射过程中引入的错误,并且
此类将向新手介绍基本的UNIX命令,以便在生物信息学中入门。Unix是Windows和MacOS之类的操作系统。但是,在UNIX中,用户通过发出命令而不是通过点击接口来与计算机进行交互。使用UNIX的能力很重要,因为许多生物信息学软件都被编写为在UNIX和UNIX型操作系统上工作。例如,请参阅Bioconda(https://bioconda.github.io/#)存储库中可用的软件列表。此外,生物信息学经常处理大型且复杂的数据集,例如源自下一代测序(NGS)的数据集,这些数据集太麻烦了,无法在具有有限的计算能力的个人计算机上分析。因此,生物信息学通常是在高性能计算系统上执行的,例如NIH的biowulf(https://hpc.nih.gov/systems/)。Biowulf在Linux(一个类似Unix的操作系统)上运行,并安装了大约1000个科学应用程序。Biowulf员工维护和更新系统以及已安装的软件。