摘要 - 诸如ChatGpt之类的LARGE语言模型(LLMS)在各种研究中都引起了人们的极大兴趣。他们出色的文本完成能力和生成能力为语言互化问题解决了一种新颖的范式。然而,这些模型在生物信息学中的潜在和功效仍未完全探索。在这项工作中,我们研究了各种关键的生物信息学任务上的绩效LLM。这些任务包括鉴定潜在的编码区域,提取基因和蛋白质的指定实体,检测抗菌和抗癌肽的检测,分子优化以及解决教育生物启发性的问题。我们的发现表明,在适当的提示下,像GPT变体这样的LLM可以成功处理大多数这些任务。此外,我们在复杂的生物信息学任务的背景下对它们的局限性进行了详尽的分析。总而言之,我们认为这项工作可以提供新的观点,并激发LLMS应用领域的未来研究,科学和生物信息学的AI。
主要关键词