计算能力的最新进展以及互联网上文本、图像和其他数据的广泛可用性为具有数十亿个参数的人工智能 (AI) 模型奠定了基础。尤其是大型语言模型,它为能够改变社会运作方式的新技术打开了大门 [ 4 ]。例如,OpenAI 的模型已经在大量数据上进行了训练,可以生成类似人类的文本 [ 5 ]。这些模型基于 Transformer 架构,该架构使用自注意力机制来模拟语言的复杂性。这些模型中最著名的是生成式预训练 Transformer 3 (GPT-3),它已被证明对一系列语言任务非常有效,例如生成文本、完成代码和回答问题 [ 5 ]。这有可能彻底改变科学家撰写和修改学术论文的方式,节省时间和精力,使研究人员能够专注于更高级的任务,例如数据分析和解释。
主要关键词