详细内容或原文请订阅后点击阅览
新的 DNA 搜索引擎为生物学大数据带来秩序
MetaGraph 将海量数据档案压缩为科学家的搜索引擎,开辟了生物发现的新领域
来源:科学美国人2025 年 10 月 14 日
3 分钟阅读
新的 DNA 搜索引擎为生物学大数据带来秩序
MetaGraph 将海量数据档案压缩为科学家的搜索引擎,开辟了生物发现的新领域
作者:Elie Dolgin 与《自然》杂志
埃利·多尔金 自然杂志互联网上有 Google。现在生物学有了MetaGraph。今天《自然》杂志对此进行了详细介绍,该搜索引擎可以快速筛选公共存储库中数量惊人的生物数据。
今天在 Nature 上详细介绍 自然 公共存储库中的数据“这是一项巨大的成就,”巴黎巴斯德研究所的生物计算研究员 Rayan Chikhi 说。他们为分析原始生物数据(包括 DNA、RNA 和蛋白质序列)“制定了新标准”,这些数据来自数据库,这些数据可能包含数百万个 DNA 字母,相当于“拍数据库”的信息,比 Google 庞大索引中的所有网页还要多。
尽管 MetaGraph 被标记为“Google for DNA”,但 Chikhi 将该工具比作 YouTube 的搜索引擎,因为这些任务对计算的要求更高。就像 YouTube 搜索可以检索每个带有红色气球的视频一样,即使这些关键词没有出现在标题、标签或描述中,MetaGraph 也可以揭示隐藏在广泛测序数据集中深处的遗传模式,而无需提前明确注释这些模式。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过订阅来支持我们屡获殊荣的新闻事业。通过购买订阅,您将有助于确保有关塑造当今世界的发现和想法的影响力故事的未来。
订阅“它可以实现用任何其他方式都无法完成的事情,”Chikhi 说。
索引生活图书馆
测序数据集 SRA 1 亿个 DNA 字母“这是一种与大量数据交互的全新方式,”Kahles 说道。 “它是压缩的,但可以即时访问。”
世界各地的抗生素耐药性 昆虫 SciAm