AI在科学领域的能力跨越了广泛的范围,从原子水平(在该量子水平)求解量子系统的部分微分方程到分子水平,预测化学或蛋白质结构,甚至扩展到社会预测,例如尤其疾病暴发。大型语言模型(LLMS)的最新进展,由诸如Chatgpt之类的模型进行了扩展,显示了涉及自然语言的任务,例如翻译语言,构建聊天机器人和回答问题。当我们考虑科学数据时,我们会注意到序列的自然语言与自然语言的相似之处 - 序列的科学文献和健康记录,以文本为单位,序列中的生物词数据或诸如大脑信号之类的传感器数据。出现的问题是:我们可以利用这些最近的LLM的潜力推动科学进步吗?在本教程中,我们将规定大型语言模型在三个至关重要的科学数据类别中的应用:1)文本数据,2)生物医学序列和3)脑信号。此外,我们将在科学研究中深入研究LLMS的挑战,包括确保信任度,实现个性化和适应多模式数据表示。
主要关键词