Loading...
机构名称:
¥ 2.0

动机。给定一个字符串S,最小化方案是由三重(k,w,o)定义的算法,该算法从字符串s采样了k -mers(k -long substring)子集的子集。具体来说,它根据s中w连续k -mers的每个窗口中的o来采样最小的k -mer。由于连续的窗口可以采样相同的k -mer,因此采样的K -mers的集合通常比s小得多。这使最小化器成为多种工具,可在生物信息学中减少多个应用程序的内存足迹和处理时间,例如序列比较,组装,压实的de bruijn图形结构和序列索引。更一般地,我们考虑尊重窗口保证的基因带抽样算法:必须从连续k -mers的每个窗口中对至少一个k -mer进行采样。作为采样k -mer的绝对位置在s中的绝对位置唯一识别,我们可以将采样算法的密度定义为不同采样位置的比例。良好的方法具有低密度,通过尊重窗口保证,将限制为1 /w。但是,很难设计具有最佳密度的序列敏捷算法。实际上,通常使用伪随机哈希函数实现O级O,以获得所谓的随机最小化器。此方案非常易于实施,即使以流方式进行计算也非常快,并且易于分析。然而,它的密度几乎距离下限的大窗口几乎有2倍。先前的工作集中在理论和实践中,与随机最小化的密度相比,其密度较低的方法。尽管如此,这些方法仍然很难分析和直观地理解,并且并不总是像随机最小化器那样通用。

将环境时间序列纳入物种分布模型

将环境时间序列纳入物种分布模型PDF文件第1页

将环境时间序列纳入物种分布模型PDF文件第2页

将环境时间序列纳入物种分布模型PDF文件第3页

将环境时间序列纳入物种分布模型PDF文件第4页

将环境时间序列纳入物种分布模型PDF文件第5页

相关文件推荐