摘要 遗传信息被编码为核苷酸的线性序列,用数千到数十亿个字母表示。序列之间的差异是通过序列分析等比较方法识别的,其中变异可能发生在单个核苷酸水平上,也可能由于重组或缺失等各种现象而集体发生。检测这些序列差异对于理解生物学和医学至关重要,但基因组数据的复杂性和大小需要大量的经典计算能力。受人类视觉感知和量子计算机上的像素表示的启发,我们利用这些技术来实现成对序列分析。我们的方法利用量子图像的灵活表示 (FRQI) 框架,能够以细粒度比较基因序列中的单个字母或氨基酸。这种新方法提高了准确性和分辨率,通过精确捕捉细微的遗传变异超越了传统方法。总之,我们的方法提供了算法优势,包括降低时间复杂度、提高空间效率和准确的序列比较。新颖之处在于应用 FRQI 算法来比较基因组测序中的量子图像,从而可以在单个字母或氨基酸水平上进行检查。这一突破有望推动生物数据分析的发展,并使我们能够更全面地了解遗传信息。 1 简介 据 Lawrence 等人称,目前国际社会正在进行重大努力,以开发全面的基因目录,以识别导致疾病发生和进展的基因 1 。最近的研究结果表明,被认为重要的癌症相关基因名单正在迅速扩大,而且速度似乎令人难以置信。Wang 等人强调迫切需要实用的诊断工具来应对 COVID-19 大流行 2 。他们指出,当前的靶标,特别是核衣壳 (N) 基因引物和广泛用于诊断的探针,正在发生突变。Hasin 等人认为氨基酸序列不仅在基因组学中起着至关重要的作用,而且在其他“组学”中也起着至关重要的作用,例如蛋白质组学、转录组学和代谢组学 3 。氨基酸序列和突变提供了有助于疾病发展的基础信息流。在生物信息学中,氨基酸序列信息以字母序列表示,可以对其进行分析以识别 RNA 和蛋白质基因产物中的差异和共同点。这种分析有助于揭示功能和结构见解。基因组分析对于优化工业药物或食品生产过程也至关重要。量子计算机是一项革命性的技术,有望推动医学和生物化学领域的序列研究。当前近期系统的局限性包括但不限于退相干、门保真度、连接性、并且缺乏错误更正 4 。量子计算为各种生化研究做出了重大贡献。Fox 等人研究了使用量子退火器 (QA) 预测 RNA 的二级结构 5 。他们展示了 QA 在识别低能耗解决方案方面的速度和有效性,提出了一种比传统算法更具竞争力的替代方案,并为 RNA 折叠预测提供了潜在的进步。Wong 和 Chang 提出了一种利用 Grover 搜索算法进行蛋白质结构预测的量子算法。与传统方法相比,他们的方法实现了二次加速,展示了量子计算在提高蛋白质结构预测效率和准确性方面的潜力 6 7 。IBM Quantum 的 qasm 模拟器上的成功模拟支持了他们的发现,强调了这一进步在药物和疫苗开发中的重要性。Robert 等人提出了一种资源高效的蛋白质折叠量子算法 8 ,而 Chandarana